Haberler

AI, çevrimiçi olarak herhangi bir genel koddan öğrenebilir mi?

AI, çevrimiçi olarak herhangi bir genel koddan öğrenebilir mi?

GitHub’ın programcıların projeleri için tamamlayıcı kod üreten yeni Copilot aracını duyurmasından birkaç gün sonra, web geliştiricisi Kyle Peacock fark ettiği bir tuhaflığı tweetledi.

“Yeni şeyler öğrenmeyi ve bir şeyler inşa etmeyi seviyorum. ”Algoritma, Hakkımda sayfası oluşturması istendiğinde yazdı. “Bir Github hesabım var.”

Hakkımda sayfasının sahte bir kişi için oluşturulduğu varsayılırken, bu bağlantı The Verge’in onaylayabildiği David Celis’in GitHub profiline gider, Copilot’un hayal gücünün bir ürünü değildir. Celis, popüler depolara sahip bir kodlayıcı ve GitHub kullanıcısıdır ve hatta daha önce şirkette çalışmıştır.

“Genel depolarımın Copilot eğitim verilerinin bir parçası olmasına şaşırmadım”

“Ben Halka açık depolarımın Copilot için eğitim verilerinin bir parçası olmasına şaşırmadım,” dedi Celis, The Verge’e, algoritmanın onun adını söylemesiyle eğlendiğini de sözlerine ekledi. Ancak Celis, eğitim verilerini papağan gibi işleyen bir algoritma tarafından adının söylenmesine aldırış etmese de, Celis, GitHub’ın yapay zekasını iyileştirmek için bulabildiği herhangi bir kodu toplamasının telif hakkıyla ilgili sonuçlarından endişe duyuyor.

Ne zaman? GitHub, 29 Haziran’da Copilot’u duyurdu ve şirket, algoritmanın GitHub’a gönderilen herkese açık kod üzerinde eğitildiğini söyledi.

Copilot sayfasında, “Makine öğrenimi modellerinin herkese açık veriler üzerinde eğitilmesi, makine öğrenimi topluluğu genelinde adil kullanım olarak kabul edilir” diyor.

Ancak yasal sorun, Friedman’ın kulağa geldiği kadar çözülmüş değil – ve kafa karışıklığı sadece GitHub’ın çok ötesine ulaşır. Yapay zeka algoritmaları, yalnızca analiz ettikleri büyük miktarda veri nedeniyle çalışır ve bu verilerin çoğu açık internetten gelir. Kolay bir örnek, tamamen ImageNet yaratıcılarının sahip olmadığı, kamuya açık görüntülerden oluşan, belki de en etkili AI eğitim veri kümesi olan ImageNet olabilir. Bir mahkeme, bu kolayca erişilebilir verilerin kullanılmasının yasal olmadığını söylerse, eğitim AI sistemlerini çok daha pahalı ve daha az şeffaf hale getirebilir.

Ayrıntılar, bir algoritma kendi medyasını oluşturduğunda değişir

GitHub’a rağmen Texas Law Review’da AI veri kümeleri ve adil kullanım hakkında geçen yıl bir makale yayınlayan Stanford Hukuk Fakültesi’nden Mark Lemley ve Bryan Casey’e göre, ABD’de halka açık eğitim verilerini adil kullanım olarak destekleyen doğrudan bir yasal emsal yok. .

Bu, buna karşı oldukları anlamına gelmez: Lemley ve Casey, algoritmaların iyileştirilmesi ve makine öğrenimi topluluğunun normlarına uyması için halka açık verilerin adil kullanım olarak kabul edilmesi gerektiğini yazıyor.< /p>

Ve bu görüşü destekleyen geçmiş vakalar olduğunu söylüyorlar.

Yüksek Mahkeme, yeni aracın orijinal çalışmayı dönüştürdüğü ve okuyucular ile yazarlar için geniş ölçüde faydalı olduğu gerekçesiyle Google’ın adil kullanım iddiasını onayladı.

“Telif hakkıyla korunan tüm bu bilgileri bir araya getirme yeteneği konusunda bir tartışma yok. Casey, Google Kitaplar vakası hakkında şunları söylüyor: “Bir makinenin çıktısı hala bulanık ve çözülecek.”

Bu, algoritma kendi medyasını oluşturduğunda ayrıntıların değiştiği anlamına gelir. Lemley ve Casey makalelerinde, eğer bir algoritma Ariana Grande tarzında şarkılar üretmeye başlarsa veya bir kodlayıcının bir soruna yeni çözümünü doğrudan koparırsa, adil kullanım tanımının çok daha belirsiz hale geldiğini savunuyorlar.

Çünkü bu doğrudan bir mahkemede test edilmedi, bir yargıç teknolojinin gerçekte ne kadar çıkarcı olduğuna karar vermeye zorlanmadı: Bir yapay zeka algoritması telif hakkıyla korunan çalışmayı karlı bir teknolojiye dönüştürürse, o zaman alan dışında olmaz bir yargıcın, yaratıcısının aldıkları şey için ödeme yapması veya başka bir şekilde kredi vermesi gerektiğine karar verme olasılığı.

Fakat diğer yandan, bir yargıç GitHub’ın herkese açık kodla ilgili eğitim tarzının adil olduğuna karar verecekse GitHub ve OpenAI’nin eğitim verilerini yazan kodlayıcıların lisanslarından alıntı yapma ihtiyacını ortadan kaldıracaktır.

“Mutlaka başka birinin çalışmasında kelimesi kelimesine görünmesi için değil, ancak daha iyi eğitimli AI’larımız varsa hepimiz daha iyi durumdayız.”.

Click to comment

Leave a Reply

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Popüler Gönderiler

To Top