An Application of Tweedie Regression
No Thumbnail Available
Date
2025
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Bu çalışmada, bağımlı değişkenin sayıma dayalı olarak elde edilmesi durumunda Poisson, negatif binomial, tweedie, gamma ve ters Gaussian doğrusal olmayan regresyonlarının performansları karşılaştırılmıştır. Model uyum ölçütlerine göre veri setini en iyi açıklayan model gamma regresyonu olmuştur. Bu modeli negatif binomial regresyon takip etmiştir. Bu duruma özellikle sıfır gözlemlerin çok fazla sayıda olması etkili olmuştur. Sıfır gözlemlerinin farklı oranlarına göre bu doğrusal olmayan regresyon modellerinin etkinliği de değişmektedir. Aşırı yayılım 16.127 olarak elde edilmiştir. Hem sıfır yayılım hem de aşırı yayılım Poisson regresyonundaki model uyum ölçütlerinin daha büyük çıkmasına neden olmuştur. Aşırı yayılım ve sıfır yayılımdan dolayı en çok olabilirlik parametre tahminleri farklılık göstermiştir. Bu çalışmada tweedie dağılımı ve regresyonu incelenerek diğer regresyon modelleri arasındaki ilişkileri ortaya konmuştur. Tweedie regresyonu hem doğrusal hem de doğrusal olmayan modellerde kullanılmaktadır. Bu nedenle çok geniş bir kullanım alanına sahiptir.
In this study, the performance of Poisson, negative binomial, Tweedie, gamma, and inverse Gaussian nonlinear regressions was compared when the dependent variable is obtained based on count data. According to the model fit criteria, the gamma regression was found to be the best model explaining the dataset, followed by the negative binomial regression. This was particularly influenced by the high number of zero observations. The effectiveness of these nonlinear regression models also varied depending on the different proportions of zero observations. Overdispersion was found to be 16.127. Both zero inflation and overdispersion led to higher model fit criteria values for the Poisson regression. Due to overdispersion and zero inflation, parameter estimates for the likelihood function showed the most differences. In this study, the Tweedie distribution and regression were examined to reveal their relationships with other regression models. Tweedie regression is used in both linear and nonlinear models, making it highly versatile with a wide range of applications.
In this study, the performance of Poisson, negative binomial, Tweedie, gamma, and inverse Gaussian nonlinear regressions was compared when the dependent variable is obtained based on count data. According to the model fit criteria, the gamma regression was found to be the best model explaining the dataset, followed by the negative binomial regression. This was particularly influenced by the high number of zero observations. The effectiveness of these nonlinear regression models also varied depending on the different proportions of zero observations. Overdispersion was found to be 16.127. Both zero inflation and overdispersion led to higher model fit criteria values for the Poisson regression. Due to overdispersion and zero inflation, parameter estimates for the likelihood function showed the most differences. In this study, the Tweedie distribution and regression were examined to reveal their relationships with other regression models. Tweedie regression is used in both linear and nonlinear models, making it highly versatile with a wide range of applications.
Description
Keywords
İstatistik, Statistics
Turkish CoHE Thesis Center URL
WoS Q
Scopus Q
Source
Volume
Issue
Start Page
End Page
74