YYÜ GCRIS Basic veritabanının içerik oluşturulması ve kurulumu Research Ecosystems (https://www.researchecosystems.com) tarafından devam etmektedir. Bu süreçte gördüğünüz verilerde eksikler olabilir.
 

Examination of User Response States To Information Center Services Using a Data Mining Approach

dc.contributor.advisor Kara, Mahmut
dc.contributor.author Dayan, Engin
dc.date.accessioned 2025-06-01T20:11:17Z
dc.date.available 2025-06-01T20:11:17Z
dc.date.issued 2025
dc.department Fen Bilimleri Enstitüsü / İstatistik Ana Bilim Dalı
dc.description.abstract Geleneksel kütüphane hizmet anlayışından farklı olarak günümüzde çok yönlü ve büyük miktarlarda üretilen bilgi gerçek kullanıcısı için erişilebilir olmuştur. Bu paradigma değişimi, kullanıcıların bilgiye erişimini kolaylaştırma görevini üstlenen kütüphaneler için çeşitli zorlukları beraberinde getirmiştir. Bu zorlukların yanı sıra, kullanıcıların bilgiyi elde etme davranışında karşılaştığı olumsuzluklar çevrimiçi bilgiye erişim sürecini erken sonlandırmalarına veya tamamen terk etmelerine neden olabilmektedir. Araştırma sürecinden ayrılma riski taşıyan kullanıcıların davranışlarının ve bilgi erişimindeki olası başarısızlıklarının erken aşamada tahmin edilmesi, kütüphane kullanım sürecinin etkinliğini artırmak açısından kritik bir rol oynamaktadır. Bu çalışma kapsamında, kütüphane kullanıcılarının bilgi erişim süreçleri ve kütüphane kaynaklarının kullanımına ilişkin veriler titizlikle analiz edilerek anlamlı bilgilere dönüştürülmüştür. Elde edilen bulgular doğrultusunda, kullanıcıların bilgiye erişim sürecinde karşılaştıkları güçlükleri ortadan kaldırmaya veya en aza indirmeye yönelik uygulanabilir bir model önerisi geliştirilmiştir. Bu çalışma kapsamında kullanıcıların araştırma süreçleri ile ilgili verilerin toplandığı üniversite kütüphanesi otomasyonu araştırma amacı çerçevesinde kullanılmıştır. Çalışmada kullanılan veriler bu otomasyonda biriken büyük web günlük dosyalarından elde edilmiştir. Kullanıcıların araştırma başarım performansının, çevrimiçi ortamdan elde edilen değişkenlere dayalı olarak modellenmesi, araştırma sürecini terk etme eğilimi gösteren bireylerin erken aşamada belirlenmesi ve araştırma sürecinin sonunda ortaya çıkabilecek olası başarısızlıkların öngörülmesi açısından büyük önem taşımaktadır. Elde edilen modeller, uyarlanabilir çevrimiçi araştırma ortamlarında kullanıcıların faaliyet düzeylerini değerlendirerek otomatik olarak sınıflandırılmasına veya otomatik uyarlamaların gerçekleştirilmesine yönelik araçlar olarak işlev görebilir. Çalışma Ocak 2022'den Haziran 2023 tarihleri arasındaki 18 takvim ayını kapsayan kullanıcı verilerinden oluşmaktadır. Veriler, Van Yüzüncü Yıl Üniversitesi Ferit Melen Merkez Kütüphanesi otomasyonu üzerinden elde edilmiştir. Otomasyon sağlayıcı firmadan günlük olarak tutulmuş log dosyası şeklindeki veriler alınmıştır. Veriler günlük işlemleri kapsayan toplam 459 adet txt. formatlı dosyadan oluşmaktaydı. Log dosyasını excel dosyası dönüşümü sonrasında toplam 328 bin 100 satırdan oluşmaktadır. Her bir eylem, kullanıcılara özgü benzersiz bir kimlik kodu (kullanıcı IP'si) ile temsil edilmiştir. Bu şekilde bireysel düzeyde izlemi anonim bir şekilde sağlamıştır. Arama sürecinden ayrılma riski taşıyan kullanıcıları belirlemek amacıyla toplam yapılmış kullanım verileri üzerinden veri analizi gerçekleştirilmiştir. Kullanıcıların etkinlik değişkenleri hesaplanmıştır. Bununla birlikte kullanıcı eylemleri, veri kümesinde bulunan diğer kullanıcıların eylemleriyle karşılaştırılarak çeşitli ölçümler oluşturulmuş ve arama davranışını yansıtan 18 adet değişken belirlenmiştir. Kullanıcıların araştırma ii performansları ise hipotetik hesaplama kullanılarak 'geçti' – 'kaldı' biçiminde kodlanmıştır. Bu araştırmanın parametreleri dâhilinde, kullanıcıların araştırma faaliyetlerine ilişkin verilerin toplanmasını kolaylaştıran üniversite kütüphanesi otomasyon sistemi, bilimsel inceleme amacıyla kullanılmıştır. Bu analizde kullanılan veriler, söz konusu otomasyon sistemi içerisinde biriken kapsamlı web günlük dosyalarından elde edilmiştir. Çevrimiçi ortamdan çıkarılan değişkenlere dayalı olarak kullanıcıların araştırma başarı performanslarının modellenmesi, araştırma sürecinden ayrılma eğilimi gösteren bireylerin öngörülmesi ve olası başarısızlıkların erken aşamada belirlenmesi açısından büyük önem taşımaktadır. Elde edilen modeller, uyarlanabilir çevrimiçi araştırma bağlamlarında kullanıcıların otomatik sınıflandırılmasına olanak tanıdığı gibi, ortamda gözlemlenen etkinlik yoğunluğuna bağlı olarak otomatik düzenlemeler yapılmasını da sağlayabilir. İlk araştırma sorusuna yanıt aramak amacıyla, kullanıcıların araştırma başarı performanslarını en iyi şekilde tahmin edebilecek algoritma ve değişkenleri belirlemek için çeşitli sınıflandırma algoritmaları ve ön işleme teknikleri sistematik bir şekilde karşılaştırılmıştır. Araştırma başarısıyla ilgili bir diğer problem kapsamında, seçilen algoritma ve değişkenler kullanılarak, kullanıcıların araştırma performanslarının önceki haftalarda öngörülüp öngörülemeyeceği araştırılmıştır. Son araştırma sorusu bağlamında ise, çevrimiçi öğrenme ortamında benzer davranış örüntüleri sergileyen kullanıcı grupları belirlenmiş ve bu grupların araştırma başarı performansı ile olan ilişkisi incelenmiştir. Veritabanlarında gizli kalmış içgörüleri ve örüntüleri ortaya çıkarmak için kabul gören yöntemlerden biri olan veri madenciliğinden yararlanılmıştır. Öngörüsel analizler için sınıflandırma algoritmaları kullanılırken, benzer kullanıcı gruplarını tespit etmek amacıyla kümeleme algoritmalarından faydalanılmıştır. Öngörü analizlerinde elde edilen sonuçların genelleştirilmesi ve kümeleme analizinde en uygun küme sayısının belirlenmesi için çapraz geçerlilik yöntemi uygulanmıştır. Çalışma sonucunda, araştırma süresi boyunca kullanıcı aktivitelerindeki değişimlerin belirlenmesinin, risk altındaki kullanıcıların henüz araştırma sürecini bırakmadan önce gerçek zamanlı olarak tespit edilmesine yardımcı olabileceği bulunmuştur. Süreç boyunca kullanıcı verilerinin aylık olarak incelenmesi, genel ortalamalardan sapma gösteren, olağan dışı davranış sergileyen kullanıcıları belirleyerek erken uyarı sistemleri geliştirmesine olanak tanıyabilir. Ayrıca, sorumlu mentörlerin ya da öğretim üyelerinin sorumlu oldukları kullanıcıları web sitesi kullanım verileri sonucundaki analizler yardımıyla gözlemlemelerine ve beklentilerine uygun hareket etmeyen kullanıcıları belirlemelerine olanak sağlamaktadır. Araştırmanın sonuçları, kullanıcıların çevrimiçi arama etkileşim verilerinin araştırma başarı performanslarını tahmin etmek için etkin bir şekilde kullanılabileceğini ortaya koymuştur. En yüksek doğruluk oranı, verilerin eşit genişlik yöntemiyle kesikli hâle getirildiği ve en iyi on değişkenin ReliefF skorlama sistemine göre seçildiği durumda elde edilmiştir. Bu durumda, Destek Vektör Makinesi (SVM) algoritması, kullanıcıların %99'unu doğru bir şekilde sınıflandırmayı başarmıştır. Kullanıcıların nihai araştırma başarı performanslarının önceki haftalardan tahmin edilip edilemeyeceğine ilişkin analizler incelendiğinde, dördüncü hafta itibarıyla %97 doğruluk oranıyla tahmin edilebileceği belirlenmiştir. Kümeleme analizlerinin sonuçları değerlendirildiğinde, kullanıcıların çevrimiçi araştırma ortamındaki etkinlik seviyelerine göre ideal olarak üç farklı kümede gruplandığı görülmüştür: aktif olmayan, aktif ve çok aktif. Daha sonra bu kümelerin araştırma başarı iii performanslarıyla olan ilişkisi incelenmiştir. Bulgular, aşağıdaki sonuçları ortaya koymuştur: Süreç boyunca minimum düzeyde etkileşim gösteren kullanıcılar, düşük araştırma performansı sergilemiştir (düşük düzeyde arama katılımı), orta düzeyde etkileşim gösteren kullanıcılar, orta düzeyde araştırma başarısı göstermiştir (orta düzeyde arama katılımı), yüksek etkileşim seviyesine sahip kullanıcılar ise, yüksek araştırma performansı sergilemiştir (yüksek düzeyde arama katılımı). Bu sonuçlar, veri madenciliği ve öğrenme analitiklerinin çevrimiçi araştırma ortamlarında kullanıcı etkileşimini artırmak ve akademik başarıyı iyileştirmek için etkin bir şekilde kullanılabileceğini göstermektedir. Anahtar kelimeler: Bilgi arama davranışı, Kişiselleştirme, Kullanıcı davranışları, Kütüphaneler ve bilgi merkezleri, Kütüphane kullanıcıları, Karar ağacı, Kümeleme, Öğrenme analitiği, Sınıflandırma, Veri madenciliği, Yapay sinir ağı
dc.description.abstract In contrast to the conventional library service paradigm, the contemporary landscape has witnessed the emergence of multifaceted and extensive volumes of information that are readily accessible to actual users. This paradigm shift has engendered a myriad of challenges for libraries, whose imperative is to facilitate user access to information. Furthermore, the complexities faced by users in their quest for information often lead to premature abandonment or cessation of the online information access process. The capacity to forecast, at an incipient stage, the behaviors of users likely to disengage from the research process and their potential failures in information retrieval is vital for optimizing library utilization. Through the present study, data pertaining to the usage of library resources and the processes of information access among library users were meticulously analyzed and subsequently transformed into actionable insights. Drawing upon the insights gleaned from this analysis, a pragmatic model proposal was formulated with the objective of mitigating or alleviating the challenges users encounter in their pursuit of information access. Within the scope of this study, the university library automation system, where data related to users' research processes were collected, was used for research purposes. The data used in the study were obtained from large web log files accumulated in this automation system. Modeling the performance of users in terms of research success, predicated upon variables derived from the online environment, is of paramount importance for the early identification of individuals who exhibit a propensity to abandon their research endeavors and may experience potential failures at the culmination of the research process. The resultant models can serve as instrumental tools for the automatic categorization of users by assessing their levels of activity within adaptive online research environments or for implementing automated modifications. The study consists of user data covering an 18-calendar-month period between January 2022 and June 2023. The data were obtained from the Ferit Melen Central Library Automation System at Van Yüzüncü Yıl University. The log files, recorded daily by the automation provider, were collected in a total of 459 text files containing daily operations. After converting the log files into an Excel file, the data consisted of 328,100 rows in total. Each action was represented by a unique identification code specific to users (user IP), ensuring anonymous tracking at an individual level. A data analysis was conducted based on the total usage data to identify users at risk of leaving the search process. The activity variables of users were calculated. Additionally, various measurements were created by comparing user actions with those of other users in the dataset, and 18 variables reflecting search behavior were identified. Users' research performance was hypothetically coded as 'passed' – 'failed.' vi Within the parameters of this investigation, the automation system of the university library, which facilitated the collection of data pertinent to users' research activities, was employed for scholarly inquiry. The data utilized in this analysis were derived from extensive web log files amassed within this automation framework. The modeling of users' research success performance, predicated upon variables extracted from the online domain, is of paramount importance in forecasting individuals who are likely to disengage from the research endeavor and identifying potential failures at an incipient stage. The resultant models are amenable to automatic classification of users within adaptive online research contexts or to facilitate automated modifications predicated on the intensity of activities present in the environment. In addressing the initial research inquiry, various classification algorithms and preprocessing techniques were systematically compared to ascertain the most efficacious algorithm and variables for predicting users' research success performance. In relation to another research challenge concerning success, an investigation was conducted to ascertain whether users' research performance could be anticipated in the earlier weeks leveraging these variables and the selected algorithm. For the concluding research inquiry, user cohorts exhibiting analogous behavioral patterns within the online learning milieu were delineated, and their correlation with research success performance was scrutinized. To unearth latent patterns and insights embedded within databases, widely recognized data mining methodologies were employed. Classification algorithms were deployed for predictive analytics, while clustering algorithms were utilized to identify akin user groups. In order to generalize the predictive outcomes and ascertain the optimal number of clusters within the clustering analysis, the cross-validation technique was instituted. The outcomes of the research elucidated that the online search interaction data of users could be adeptly leveraged to predict research success performance. The highest rate of accurate classification was accomplished when the data were discretized utilizing the equal-width binning methodology, and the top ten variables were selected based on the ReliefF scoring system. In this instance, the Support Vector Machine (SVM) algorithm successfully classified 99% of users. Upon examining the analyses pertaining to the predictability of users' final research success performance from earlier weeks, it was determined that such performance could be forecasted with 97% accuracy by the fourth week. Upon review of the clustering analyses results, it was discerned that users were optimally categorized into three distinct clusters based on the levels of activity they manifested within the online research setting: inactive, active, highly active. Subsequently, the interrelation between these clusters and research success performance was investigated. The findings revealed that: Users exhibiting minimal engagement throughout the process demonstrated low research performance (low search engagement), users displaying moderate engagement manifested moderate research performance (intermediate search Engagement), users with high engagement levels showcased high research performance (high search engagement). These results signify that data mining and learning analytics can be effectively harnessed to enhance user engagement and academic achievement within online research environments. Keywords: Artificial eural network, Classification, Clustering, Data mining, Decision trees, İnformation-seeking behavior, Learning Analytics, Library and İnformation Center, Library user, Personalization, User behavior en_US
dc.identifier.endpage 139
dc.identifier.uri https://tez.yok.gov.tr/UlusalTezMerkezi/TezGoster?key=htlyhJG97gjBTPjAeWRhPo3X30UvWAC7NhOV9RCikFl1tKM1pHHVbjgKCg1y5CSs
dc.identifier.uri https://hdl.handle.net/20.500.14720/25148
dc.identifier.yoktezid 932566
dc.language.iso tr
dc.subject Dokümantasyon ve Enformasyon
dc.subject İstatistik
dc.subject Bilgi Yönetimi
dc.subject İstatistiksel Bilgiler
dc.subject İstatistiksel Tasarım
dc.subject Documentation and Information en_US
dc.subject Statistics en_US
dc.subject Information Management en_US
dc.subject Statistical Informations en_US
dc.subject Statistical Design en_US
dc.title Examination of User Response States To Information Center Services Using a Data Mining Approach
dc.title Bilgi Merkezi Hizmetlerinin Kullanıcılar Tarafından Kullanım Tepki Durumlarının Veri Madenciliği Yaklaşımı ile İncelenmesi en_US
dc.type Doctoral Thesis en_US

Files

Collections