Pamukkale Üniversitesi Mühendislik Bilimleri Dergisi

E-Ticaret ve Sosyal Medya Yorumlarının Analizinde Lemmatizasyonun Etkisi: Adlandırılmış Varlık Tanıma ve Duygu Analizi Tabanlı Bir Yaklaşım [Pamukkale Univ Muh Bilim Derg]
Pamukkale Univ Muh Bilim Derg. Baskıdaki Makaleler: PAJES-89956 | DOI: 10.65206/pajes.89956  

E-Ticaret ve Sosyal Medya Yorumlarının Analizinde Lemmatizasyonun Etkisi: Adlandırılmış Varlık Tanıma ve Duygu Analizi Tabanlı Bir Yaklaşım

Emre Şatır, Sena Yüksel, Beyza Aydoğmuş, Dila İkra AYGÜN, Neziha Beyazıt, Halim Ağdemir, Erdem Altuğ Malkan
İzmir Katip Çelebi Üniversitesi, Mühendislik ve Mimarlık Fakültesi, Bilgisayar Mühendisliği Bölümü, İzmir

İnternetin yaygınlaşmasıyla birlikte müşteriler, satın alma kararlarını verirken çevrimiçi yorumları ve puanlamaları dikkate almaktadır. Ancak, artan veri hacmi ve bilgi kirliliği, kullanıcıların doğru bilgiye ulaşmasını zorlaştırmaktadır. Bu makalede, olumsuz duygu tespitinde lemmatizasyon işleminin etkilerini incelemek amacıyla denenen üç farklı yöntem açıklanmakta ve olumsuzluk eki içeren kelimelere lemmatizasyon uygulanmamasının en başarılı sonuçları verdiği gösterilmektedir. Geliştirilen yöntem, iki farklı çalışmada kullanılarak duygu analizi doğruluğunu artırmada etkili olmuştur. İlk çalışmada, kullanıcıların ürün özelliklerine göre doğru tercihler yapmasını sağlayan bir öneri sistemi geliştirilmiştir. Burada, Trendyol e-ticaret platformundan elde edilen 85000 kullanıcı yorumuna dayalı bir veri seti kullanılmıştır. Sistem, tüketici yorumlarını adlandırılmış varlık tanıma ve duygu analizi teknikleriyle işleyerek, ürün özelliklerine yönelik puanlama yapmaktadır. Ayrıca, yorumların doğruluğunu artırmak için standart yıldız puanlama sisteminden farklı olarak "Hesaplanan Yıldız Puanı" yöntemi geliştirilmiş ve daha güvenilir bir değerlendirme sağlanmıştır. Yapılan deneyler sonucunda, adlandırılmış varlık tanıma modelinde 0.894, duygu analizi modelinde ise 0.838 F1 skoru elde edilmiştir. İkinci çalışma, müşteri yorumlarının analiz edilerek şirketlere geri bildirim sağlanmasını amaçlamaktadır. Yorumlardaki şirket isimleri adlandırılmış varlık tanıma tekniği ile belirlenmiş, ardından her bir varlık için duygu analizi yapılmıştır. Bu sayede, geleneksel yöntemlerden farklı olarak cümle bazında değil, varlık bazında duygu belirleme gerçekleştirilmiştir. Bu çalışmada hem adlandırılmış varlık tanıma hem de duygu analizi modelinde 0.801 F1 skoru elde edilmiştir. Elde edilen sonuçlar, geliştirilen yöntemlerin müşteri deneyimini iyileştirmede etkili olduğunu göstermektedir.

Anahtar Kelimeler: Lemmatizasyon, Adlandırılmış varlık tanıma, Duygu analizi, Öneri sistemi, Müşteri geri bildirimi, Doğal dil işleme (DDİ)


The Effect of Lemmatization in the Analysis of E-Commerce and Social Media Comments: An Approach Based on Named Entity Recognition and Sentiment Analysis

Emre Şatır, Sena Yüksel, Beyza Aydoğmuş, Dila İkra AYGÜN, Neziha Beyazıt, Halim Ağdemir, Erdem Altuğ Malkan
Izmir Katip Celebi University, Faculty of Engineering and Architecture, Computer Engineering Department, Izmir

With the widespread use of the Internet, customers consider online reviews and ratings when making purchasing decisions. However, increasing data volume and information pollution make it difficult for users to access accurate information. This paper describes three different methods tested to examine the effects of lemmatization on negative sentiment detection and show that not applying lemmatization to words containing negativity suffixes yields the most successful results. The developed method was used in two different studies to improve the accuracy of sentiment analysis. In the first study, a recommendation system was developed to help users make the right choices based on product features. Here, a dataset based on 85000 user reviews from the Trendyol e-commerce platform was used. The system processes consumer reviews with named entity recognition and sentiment analysis techniques to score product attributes. In addition, to increase the accuracy of the reviews, a “Calculated Star Score” method was developed different from the standard star scoring system and a more reliable evaluation was provided. As a result of the experiments, an F1 score of 0.894 was obtained in the named entity recognition model and 0.838 in the sentiment analysis model. The second study aims to provide feedback to companies by analyzing customer reviews. The company names in the reviews were identified using named entity recognition, followed by sentiment analysis for each entity. In this way, unlike traditional methods, sentiment analysis is performed on an entity basis rather than on a sentence basis. In this study, an F1 score of 0.801 was obtained in both named entity recognition and sentiment analysis models. The results show that the developed methods are effective in improving customer experience.

Keywords: Lemmatization, Named entity recognition, Sentiment analysis, Recommendation system, Customer feedback, Natural language processing (NLP)




Sorumlu Yazar: Emre Şatır, Türkiye


ARAÇLAR
Tam Metin PDF
Yazdır
Alıntıyı İndir
RIS
EndNote
BibTex
Medlars
Procite
Reference Manager
E-Postala
Paylaş
Yazara e-posta gönder

Benzer makaleler
Google Scholar