Online Makale
Online Hizmetlere Toplu BakışPamukkale Üniversitesi Mühendislik Bilimleri Dergisi
Pamukkale Univ Muh Bilim Derg. Baskıdaki Makaleler: PAJES-05400 | DOI: 10.5505/pajes.2025.05400 | |||
Anahtar Kelime Çıkarımı için Denetimsiz Hibrit Bir ModelÖzlem Örnek, Efnan Şora Günal, Eyyüp GülbandılarEskişehir Osmangazi Üniversitesi Bilgisayar Mühendisliği Bölümü, Eskişehir.Metinden ilgili sözcükleri çıkarmak, anahtar sözcük öbeği veya anahtar sözcük çıkarma olarak tanımlanabilir. Bir anahtar sözcük öbeği birden fazla sözcükten oluşurken, bir anahtar sözcük tek bir sözcük olsa da bunlar birbirinin yerine kullanılabilir. Literatürde anahtar sözcük çıkarma için farklı yöntemler bulunmasına rağmen, denetimsiz yöntemler, alandan bağımsız olmaları ve etiketli verilerle eğitim gerektirmemeleri nedeniyle ön plana çıkmaktadır. Bu nedenle, bu çalışmada, anahtar sözcük öbeği çıkarma görevi için yeni bir denetimsiz hibrit model sunulmuştur. Önerilen model, çizge tabanlı ve gömme tabanlı yöntemlerden oluşmaktadır. Önerilen model, çizge merkezilik ölçütleri ve her bir belge için oluşturulan skip-gram gömme yöntemi kullanılarak geliştirilmiştir. Model, bir veri kümesi üzerinde değerlendirilmiş ve literatürle karşılaştırılmıştır. Kapsamlı deneyler sonucunda, modelimizin istatistiksel modellerle karşılaştırılabilir performans sağladığı, diğer çizge tabanlı ve gömme tabanlı modellerden daha iyi performans gösterdiği gözlenmiştir. Anahtar Kelimeler: Anahtar kelime çıkarma, Denetimsiz öğrenme, Hibrit model, Graf tabanlı yöntem, Kelime gömme.An Unsupervised Hybrid Model for Keyphrase ExtractionÖzlem Örnek, Efnan Şora Günal, Eyyüp GülbandılarDepartment of Computer Engineering, Eskişehir Osmangazi University, Eskişehir, TürkiyeExtracting the pertinent words from a text can be defined as keyphrase or keyword extraction. While a keyphrase consists of multiple words and a keyword is a single word, they can also be used interchangeably. Though there are different methods for keyword extraction in the literature, unsupervised methods come to the fore with their independence from the domain and not needing training with labeled data. Hence, in this work, a new unsupervised hybrid model is presented for the keyphrase extraction task. The proposed model consists of a graph-based and an embedding-based method. The proposed model is developed using the graph centrality criteria and the skip-gram embedding method created for each document. The model was evaluated on a dataset and compared with the literature. Following comprehensive experiments, it was observed that our model provided comparable performance with statistical models, while outperforming other graph-based and embedding-based models. Keywords: Keyphrase extraction, Unsupervised learning, Hybrid model, Graph-based method, Word embedding.Sorumlu Yazar: Özlem Örnek, Türkiye |
|