Synthetic Data Generation With Competitive Generative Adversarial Networks (gan)
No Thumbnail Available
Date
2022
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Çekişmeli üretici ağlar olarak adlandırılan üretici modeller, klasik derin ağ mimarilerinden farklı olarak, üretici ağlar (Ü) ve ayırt edici ağlar (A) olmak üzere iki farklı derin ağa sahiptir. Bu iki ağın çekişmesi ile öğrenme işlemi gerçekleştirilmektedir. ÇÜA modelleri, sentetik görüntülerin ve metinlerin oluşturulmasında büyük olanaklar sağlamıştır. Son birkaç yılda, geleneksel istatistiksel tekniklerin aksine veri dağılımlarını modelledikleri, büyük esneklik sundukları ve tablo halinde veri ürettikleri için ÇÜA'lar kullanılmaya başlanmıştır. Bu çalışmada tablo verilerinin modellenmesiyle ilgili olarak, TGAN, CTGAN ve CopulaGAN gibi çeşitli modellerini kullanılmaktadır. ÇÜA'lar sentetik veri üretimi için klasik yöntemlerden daha iyi sonuçlar göstermiştir. Spesifik olarak, modeller, bu yöntemin ihtiyaç duyduğu sınırlamalar ve gereksinimler göz önünde bulundurularak deprem veri setinin ÇÜA modelleri üzerinden eğitilmektedir. Üretilen sentetik veriler görsel, istatistiksel ve makine öğrenimi tabanlı olarak değerlendirilmektedir.
Generator models, called contentious generator networks, have two different deep networks, namely generator networks (G) and distinctive networks (D), unlike classical deep network architectures. It performs the learning process by the contention of these two networks. GAN models have opened up great possibilities in the creation of synthetic images and text. In the last few years, GANs have started to be used because they model data distributions, offer great flexibility, and produce tabular data, unlike traditional statistical techniques. In this study, various algorithms such as TGAN, CTGAN and CopulaGAN are used for modeling tabular data. GANs showed better results than classical methods for synthetic data generation. Specifically, the models are trained on the GAN models of the earthquake dataset, taking into account the limitations and requirements of this method. The synthetic data produced are evaluated visually, statistically and based on machine learning.
Generator models, called contentious generator networks, have two different deep networks, namely generator networks (G) and distinctive networks (D), unlike classical deep network architectures. It performs the learning process by the contention of these two networks. GAN models have opened up great possibilities in the creation of synthetic images and text. In the last few years, GANs have started to be used because they model data distributions, offer great flexibility, and produce tabular data, unlike traditional statistical techniques. In this study, various algorithms such as TGAN, CTGAN and CopulaGAN are used for modeling tabular data. GANs showed better results than classical methods for synthetic data generation. Specifically, the models are trained on the GAN models of the earthquake dataset, taking into account the limitations and requirements of this method. The synthetic data produced are evaluated visually, statistically and based on machine learning.
Description
Keywords
İstatistik, Deprem, Deprem kayıtları, Sentetik veriler, Üretici ağlar, Statistics, Earthquake, Earthquake records, Synthetic dataset, Producer networks
Turkish CoHE Thesis Center URL
WoS Q
Scopus Q
Source
Volume
Issue
Start Page
End Page
70