Büyük Dil Modellerinin Matematik Yetenekleri İlk Kez Test Edildi
Büyük dil modellerinin matematiksel yeteneklerini ölçen “First Proof” meydan okumasının sonuçları açıklandı. 11 matematikçi tarafından başlatılan bu test, Sevgililer Günü sabahı sonuçlandı. 10 matematik probleminin hangilerinin insan yardımı olmaksızın çözüldüğü henüz netlik kazanmadı. Ancak hepsiyle ilgili ortak bir nokta var, hiçbir büyük dil modeli tüm soruları çözemedi.
First Proof ekibi, matematikte daha büyük sonuçlar elde etmek için 10 “lemma” sundu. Bu ara teoremler, matematikçilerin günlük pratiklerinde karşılaşabileceği problemleri içeriyor. Yapılan açıklamalara göre, seçilen problemler standart tekniklerle çözülemeyecek kadar özgün ve karmaşıktı.
Meydan okuma, yapay zekânın sınırlarını test etmenin yanı sıra matematik camiasında da büyük bir ilgi uyandırdı. Öte yandan, bazı çözümlerde insan katkısı olup olmadığı konusunda da belirsizlikler bulunuyor. Yapay zekâ modellerinin ürettiği çözümlerin doğruluğu da bir o kadar tartışmalı.
Yapay zekâ şirketleri ve matematikçiler arasında yapılan bu meydan okuma, matematik dünyasında büyük bir dönüşüme sebep olabilir. Ancak matematiğin özgünlük ve doğruluk gibi önemli prensipleri göz önünde bulundurularak yapılacak çalışmaların daha detaylı olması bekleniyor.