Other Titles
Stemming Turkish Words with LSTM NetworksAbstract
Türkçe, morfem adı verilen birimlerin art arda eklenmesiyle sözcüklerin oluşturulduğu sondan eklemeli bir dildir. Sözcüklerin farklı parçaların birleştirilmesiyle oluşturulması makine tercümesi, duygu analizi ve bilgi çıkarımı gibi birçok doğal dil işleme uygulamasında seyreklik problemine yol açmaktadır çünkü sözcüğün her farklı formu farklı bir sözcük gibi algılanmaktadır. Bu makalede, sözcüklerin yapım ve çekim eklerinden arındırılarak köklerinin otomatik olarak bulunabilmesi için bir yöntem öneriyoruz. Kullandığımız yöntem tekrarlayan sinir ağları kullanarak oluşturulan kodlayıcı-kod çözücü yaklaşımına dayanmaktadır. Verilen herhangi bir sözcük, oluşturduğumuz sinir ağı yapısı ile öncelikle kodlanmakta, ardından kodu çözülerek köküne ulaşılabilmektedir. Bu yöntem şimdiye kadar etiketleme veya makine tercümesi gibi problemlerde kullanılmıştır. Diğer Türkçe kök bulma modelleriyle karşılaştırıldığında sonuçların oldukça iyi olduğu gözlenmiştir. Diğer modellerde olduğu gibi, herhangi bir kural kümesi elle tanımlanmadan, sadece sözcük ve kök ikililerinden oluşan bir eğitim veri kümesi kullanılarak kök bulma işlemi önerdiğimiz bu model ile gerçekleştirilebilmektedir.Citation
Can, Burcu (2019) LSTM Ağları ile Türkçe Kök Bulma. Bilişim Teknolojileri Dergisi, 12(3), pp. 183-193.Publisher
Gazi ÜniversitesiJournal
Bilişim Teknolojileri DergisiAdditional Links
https://dergipark.org.tr/tr/pub/gazibtd/issue/47484/486042Type
Journal articleLanguage
otherDescription
© 2019 Journal of Information Technologies (BTD). For re-use please contact the publisher.ISSN
2147-0715ae974a485f413a2113503eed53cd6c53
10.17671/gazibtd.486042