Neler yeni

Wikipedia ve Kaggle’dan Yapay Zekâ Geliştiricilerine Yeni Veri Seti Ortaklığı

Wikimedia Vakfı ile Google’ın sahip olduğu veri bilimi platformu Kaggle, makine öğrenimi alanında çalışan geliştiricilere yönelik olarak yapılandırılmış Wikipedia verilerinden oluşan yeni bir beta veri seti yayımladı. Bu iş birliği, hem yapay zekâ geliştirme sürecini desteklemeyi hem de Wikipedia sunucularına yönelik yoğun veri tarama yükünü hafifletmeyi hedefliyor.
1000078458.webp
Wikimedia Vakfı, İngilizce ve Fransızca dillerinde yapılandırılmış Wikipedia içeriklerinden oluşan yeni bir beta veri setini yayımlamak üzere Kaggle ile önemli bir iş birliğine gitti. Bu veri seti, özellikle yapay zekâ ve makine öğrenimi modellerini eğitmek, iyileştirmek, test etmek ve hizalamak isteyen geliştiricilere yönelik olarak hazırlandı.

Yayımlanan veri seti; makine tarafından okunabilir şekilde hazırlanmış araştırma özetleri, kısa tanımlar, görsel bağlantıları, bilgi kutuları ve madde başlıkları gibi yapılandırılmış içerikler içeriyor. Ancak referans kaynakları, ses dosyaları gibi metin dışı unsurlar bu veri setine dahil edilmedi.

Wikipedia'nın açık lisanslı bu içeriği, özellikle küçük firmalar ve bağımsız araştırmacılar için daha erişilebilir ve sürdürülebilir bir kaynak sağlamayı amaçlıyor. Bu sayede, geliştiricilerin Wikipedia sunucularına zarar verebilecek yoğun veri tarama (scraping) işlemlerine başvurmadan içeriklere ulaşmaları mümkün olacak.

Wikimedia, daha önce Google ve Internet Archive gibi büyük kuruluşlarla yaptığı içerik paylaşım anlaşmalarına bu projeyle bir yenisini eklemiş oldu. Kaggle üzerinden sunulan bu yeni veri seti, yapay zekâ dünyasına açık bilgiyle daha etkili ve etik yollarla katkı sunma hedefini taşıyor.
 

Forum istatistikleri

Konular
69
Mesajlar
72
Kullanıcılar
3
Son üye
gozanli
Geri
Üst