Skip to content

Latest commit

 

History

History
17 lines (10 loc) · 1.48 KB

File metadata and controls

17 lines (10 loc) · 1.48 KB

KARAYEL Takımı - Teknofest 2024 Doğal Dil İşleme Yarışması - Doğal Dil İşleme Senaryosu Kategorisi

Verilen senaryo kapsamında müşteri şikayetlerinin içerisinde geçen markalar tespit edilecek, ardından her bir marka için ayrı bir duygu durumu analizi yapılacaktır.
Bu doğrultuda takım olarak öncelikle bu görevi Pretrained Instruction Modeller ile verimli bir eğitim sonrası çözebileceğimizi düşünerek GPT-2 ve gemma2b modelini eğitmeye çalıştık. Yaptığımız eğitimler sonrası elde ettiğimiz model, json yapısı ve entity'leri tespit etmekte oldukça başarılı iken özellikle karmaşık cümlelerde duygu analizi yapmakta zorlanıyordu. Dolayısıyla bu görevi NER + ABSA olacak şekilde tekrar düzenledik ve model geliştirmelerinde bulunduk.

Yarışma süresince geliştirilen modeller Hugging Face sayfamız üzerinden paylaşılmıştır:\

Karayel Nazır-ABSA
Karayel Nazır-NER

Eğitimler sırasında kullanılmak üzere hazırladığımız veri setinin hazırlık aşamalarını hızlandırmak ve iyileştirmek adına araçlar geliştirdik. Araçlarımızın kaynak kodlarına aşağıdan ulaşabilirsiniz.\

Veri kazıma işlemleri: Karayel-Uren
Veri etiketleme işlemleri: Karayel-Label-App

#Acıkhack2024TDDİ #Türkiye Açık Kaynak Platformu