Skip to content

karayel-ddi/Teknofest_2024_ddi_senaryo_kategorisi

Repository files navigation

KARAYEL Takımı - Teknofest 2024 Doğal Dil İşleme Yarışması - Doğal Dil İşleme Senaryosu Kategorisi

Verilen senaryo kapsamında müşteri şikayetlerinin içerisinde geçen markalar tespit edilecek, ardından her bir marka için ayrı bir duygu durumu analizi yapılacaktır.
Bu doğrultuda takım olarak öncelikle bu görevi Pretrained Instruction Modeller ile verimli bir eğitim sonrası çözebileceğimizi düşünerek GPT-2 ve gemma2b modelini eğitmeye çalıştık. Yaptığımız eğitimler sonrası elde ettiğimiz model, json yapısı ve entity'leri tespit etmekte oldukça başarılı iken özellikle karmaşık cümlelerde duygu analizi yapmakta zorlanıyordu. Dolayısıyla bu görevi NER + ABSA olacak şekilde tekrar düzenledik ve model geliştirmelerinde bulunduk.

Yarışma süresince geliştirilen modeller Hugging Face sayfamız üzerinden paylaşılmıştır:\

Karayel Nazır-ABSA
Karayel Nazır-NER

Eğitimler sırasında kullanılmak üzere hazırladığımız veri setinin hazırlık aşamalarını hızlandırmak ve iyileştirmek adına araçlar geliştirdik. Araçlarımızın kaynak kodlarına aşağıdan ulaşabilirsiniz.\

Veri kazıma işlemleri: Karayel-Uren
Veri etiketleme işlemleri: Karayel-Label-App

#Acıkhack2024TDDİ #Türkiye Açık Kaynak Platformu

About

#Acıkhack2024TDDİ #Türkiye Açık Kaynak Platformu

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published