An alternative to EM for Gaussian mixture models: batch and stochastic Riemannian optimization

DOI10.1007/S10107-019-01381-4zbMATH Open1441.62168arXiv1706.03267OpenAlexW2627006445WikidataQ115385318 ScholiaQ115385318MaRDI QIDQ2188245FDOQ2188245

Authors: Reshad Hosseini, Suvrit Sra

Publication date: 10 June 2020

Published in: Mathematical Programming. Series A. Series B (Search for Journal in Brave)

Abstract: We consider maximum likelihood estimation for Gaussian Mixture Models (Gmms). This task is almost invariably solved (in theory and practice) via the Expectation Maximization (EM) algorithm. EM owes its success to various factors, of which is its ability to fulfill positive definiteness constraints in closed form is of key importance. We propose an alternative to EM by appealing to the rich Riemannian geometry of positive definite matrices, using which we cast Gmm parameter estimation as a Riemannian optimization problem. Surprisingly, such an out-of-the-box Riemannian formulation completely fails and proves much inferior to EM. This motivates us to take a closer look at the problem geometry, and derive a better formulation that is much more amenable to Riemannian optimization. We then develop (Riemannian) batch and stochastic gradient algorithms that outperform EM, often substantially. We provide a non-asymptotic convergence analysis for our stochastic method, which is also the first (to our knowledge) such global analysis for Riemannian stochastic gradient. Numerous empirical results are included to demonstrate the effectiveness of our methods.

Full work available at URL: https://arxiv.org/abs/1706.03267

Recommendations

zbMATH Keywords

stochastic optimization Gaussian mixture models positive definite matrices retraction Riemannian optimization non-asymptotic rate of convergence

Mathematics Subject Classification ID

Classification and discrimination; cluster analysis (statistical aspects) (62H30) Statistics on manifolds (62R30) Stochastic programming (90C15) Applications of differential geometry to data and computer science (53Z50)

Cites Work

Cited In (15)

Uses Software

This page was built for publication: An alternative to EM for Gaussian mixture models: batch and stochastic Riemannian optimization

Report a bug (only for logged in users!)Click here to report a bug for this page (MaRDI item Q2188245)