Haberler

Google aramanın bir sonraki aşaması: bağlam kraldır

Google E-Tablolar'ın formül önerileri, matematik için otomatik doldurma gibidir

Bugünkü Search On etkinliğinde Google, bir arada ele alındığında, insanların bir arama kutusuna birkaç kelime yazmaktan fazlasını yapmalarını sağlamaya yönelik şimdiye kadarki en güçlü girişimleri olan birkaç yeni özelliği tanıttı. Şirket, yeni Çok Görevli Birleşik Model (MUM) makine öğrenimi teknolojisini küçük şekillerde kullanarak, erdemli bir döngü başlatmayı umuyor: daha ayrıntılı ve bağlam açısından zengin cevaplar sağlayacak ve karşılığında kullanıcıların daha ayrıntılı ve bağlamsal sorular soracağını umuyor. -zengin sorular. Şirket, nihai sonucun daha zengin ve daha derin bir arama deneyimi olacağını umuyor.

Google Kıdemli Başkan Yardımcısı Prabhakar Raghavan, Asistan, reklamlar ve diğer ürünlerin yanı sıra aramayı denetliyor. “Aramanın çözülmüş bir sorun olmadığını” söylemeyi seviyor – ve geçen Pazar bir röportajda tekrarladı. Bu doğru olabilir, ancak onun ve ekibinin çözmeye çalıştığı sorunların artık web’i karıştırmakla daha az, orada bulduklarına bağlam eklemekle daha çok ilgisi var.

AI, Google’ın insanların sorduğu soruları keşfetmesine yardımcı olacak

Google, makine öğrenimini kullanarak ilgili konuların kümelerini tanıma yeteneğini esnetmeye ve bunları size düzenli bir şekilde sunmaya başlayacak. Google aramanın yaklaşan yeniden tasarımı, sizi farklı alt konulara gönderen “Bilinmesi gerekenler” kutularını göstermeye başlayacak.

Alışveriş sonuçları, yakındaki mağazalarda bulunan envanteri ve hatta aramanızla ilişkili farklı tarzlarda kıyafetleri göstermeye başlayacak.

Google, sizin açınızdan – belki de “sormak” daha iyi bir terim olsa da – yeni yollar sunuyor. metin kutusunun ötesine geçen arama yapmak için. Görüntü tanıma yazılımı Google Lens’i daha fazla yere taşımak için agresif bir baskı yapıyor. iOS’ta Google uygulamasına ve masaüstlerinde Chrome web tarayıcısına eklenecektir. Ve MUM ile Google, kullanıcıların yalnızca çiçekleri veya önemli noktaları belirlemekten daha fazlasını yapmasını, bunun yerine Lens’i doğrudan soru sormak ve alışveriş yapmak için kullanmasını sağlamayı umuyor.

“Bu, yükselmeye devam edeceğini düşündüğüm bir döngü” Raghavan diyor. “Daha fazla teknoloji, daha fazla kullanıcıya daha fazla erişim sağlar, kullanıcı için daha iyi ifadeye yol açar ve teknik olarak bizden daha fazlasını talep edecektir.”

Google Lens, kullanıcıların görselleri kullanarak arama yapmasına ve sorgularını metinle hassaslaştırmasına olanak tanır. Resim: Google

Arama denkleminin bu iki yanı, Google aramanın bir sonraki aşamasını başlatmak içindir; bu aşama, makine öğrenimi algoritmalarının bilgiyi doğrudan düzenleyerek ve sunarak süreçte daha belirgin hale geldiği bir aşamadır.

Büyük dil modelleri olarak bilinen sistemler (MUM bunlardan biridir) sayesinde, makine öğrenimi kelimeler ve konular arasındaki bağlantıları haritalamada çok daha iyi hale geldi. Şirketin, aramayı yalnızca daha doğru değil, aynı zamanda daha keşfedici ve umarız daha yararlı hale getirmek için kullandığı bu becerilerdir.

Google’ın örneklerinden biri öğreticidir. Bisikletinizin parçalarının ne olduğu konusunda ilk fikriniz olmayabilir, ancak bir şey bozulursa, bunu çözmeniz gerekir. Google Lens, vites değiştiriciyi (arka tekerleğin yanında asılı duran vites değiştirme parçası) görsel olarak tanımlayabilir ve size yalnızca ayrık bilgi vermek yerine, o şeyi doğrudan düzeltmekle ilgili sorular sormanıza izin vererek sizi bilgiye götürür ( bu durumda, mükemmel Berm Peak Youtube kanalı).

Çok modlu arama, kullanıcılardan tamamen yeni girdiler gerektirir

Daha fazla kullanıcının Google Lens’i daha sık açması için yapılan baskı, kendi avantajlarıyla büyüleyicidir, ancak daha büyük resim (deyim yerindeyse), Google’ın sorgularınız hakkında daha fazla bağlam toplama girişimiyle ilgilidir. Raghavan, metin ve görüntüleri birleştiren daha karmaşık, çok modlu aramalar için “sağlayıcının sahip olması gereken tamamen farklı bir bağlamsallaştırma düzeyi talep ediyor ve bu nedenle, elimizden geldiğince çok bağlama sahip olmamıza büyük ölçüde yardımcı oluyor” diyor.

Uzun zamandır bilgi kutularını, görüntü sonuçlarını ve doğrudan cevapları gösteriyor. Bugünün duyuruları, Google’ın sağladığı bilgilerin yalnızca ilgili bilgilerin bir sıralaması değil, makinelerinin web’i kazıyarak ne anladığının damıtıldığı bir başka adımdır.

Bazı durumlarda – alışverişte olduğu gibi – bu damıtma, Google’a muhtemelen daha fazla sayfa görüntüleme göndereceğiniz anlamına gelir. Lens’te olduğu gibi, bu trendi takip etmek önemlidir: Google aramaları sizi giderek Google’ın kendi ürünlerine iter. Ama burada da daha büyük bir tehlike var. Google’ın size daha fazla şey söylemesi, her zaman sahip olduğu yükü doğrudan artırıyor: daha az önyargıyla konuşmak.

Bununla iki farklı anlamda önyargıyı kastediyorum. Birincisi tekniktir: Google’ın aramayı iyileştirmek için kullanmak istediği makine öğrenimi modellerinin ırk ve cinsiyet önyargılarıyla ilgili iyi belgelenmiş sorunları vardır. Web’in geniş alanlarını okuyarak eğitilirler ve sonuç olarak, nahoş konuşma yollarını seçmeye eğilimlidirler. Google’ın AI etik ekibiyle olan sorunları da bu noktada iyi belgelenmiştir – bu konuda bir makale yayınladıktan sonra iki önde gelen araştırmacıyı işten çıkardı. Google’ın aramadan sorumlu başkan yardımcısı Pandu Nayak’ın The Verge’den James Vincent’a bugünkü MUM duyurularıyla ilgili makalesinde söylediği gibi, Google tüm dil modellerinin önyargıları olduğunu biliyor, ancak şirket bunun “insanların doğrudan tüketmesi için ortaya koymaktan” kaçınabileceğine inanıyor.< /p> “Bilinmesi Gerekenler” adlı yeni bir özellik, kullanıcıların aramalarıyla ilgili konuları keşfetmelerine yardımcı olacak.

Google size kendi bilgi sentezlerinden daha fazlasını doğrudan anlatmaya başladığında, konuştuğu bakış açısı nedir? Gazeteciler olarak sık sık sözde “hiç olmayan bakış açısının” haberlerimizi sunmanın yetersiz bir yolu olduğundan bahsediyoruz. Google’ın bakış açısı nedir? Bu, şirketin geçmişte karşılaştığı ve bazen “tek doğru cevap” sorunu olarak bilinen bir sorundur. Google, otomatik sistemler kullanarak insanlara kısa ve kesin cevaplar vermeye çalıştığında, genellikle kötü bilgiler yayıyor.

Bu soruyla sunulan Raghavan, modern dil modellerinin karmaşıklığına işaret ederek yanıt veriyor. “Neredeyse tüm dil modelleri, onlara bakarsanız, yüksek boyutlu bir uzayda gömmelerdir. Bu alanların daha yetkili olma eğiliminde olan belirli bölümleri, daha az yetkili olan belirli bölümleri vardır. Bunları mekanik olarak oldukça kolay bir şekilde değerlendirebiliriz” diye açıklıyor. Raghavan, o zaman zorluğun, bu karmaşıklığın bir kısmını, onları ezmeden kullanıcıya nasıl sunacağımız olduğunu söylüyor.

Google, kullanıcılara doğrudan yanıt veriyorsa tarafsız kalabilir mi?

Ancak asıl yanıtın, en azından şimdilik, Google’ın suçlanabileceği alanlardan kaçınarak arama motorunun bakış açısıyla ilgili soruyla yüzleşmekten kaçınmak için elinden geleni yaptığı hissine kapılıyorum. Raghavan bunu “aşırı editoryalleştirme” olarak ifade ediyor. Genellikle Google yöneticileriyle bu önyargı ve güven sorunları hakkında konuşurken, bu yüksek boyutlu alanların “yetkililik” gibi tanımlanması daha kolay kısımlarına odaklanırlar.

Örneğin, bir sözcü Google’ın “izin vermediğini veya vermediğini” söylese de, biri Google’ın “özellikle zararlı/hassas” olarak tanımladığı şeyleri aradığında Google’ın yeni “Bilinmesi gerekenler” kutuları görünmeyecektir. ancak sistemlerimiz, bu tür özelliklerin tetiklemesi gereken veya tetiklememesi gereken konuları ölçeklenebilir bir şekilde anlayabilir.”

Google araması, girdileri, çıktıları, algoritmaları ve dil modellerinin tümü neredeyse hayal edilemeyecek kadar karmaşık.

(Google, kayıt için yalnızca YouTube’un bir alt kümesinin ses dökümlerini dizine ekliyor, ancak MUM ile gelecekte görsel dizin oluşturma ve diğer video platformları yapmayı hedefliyor).

Genellikle bilgisayar bilimcileriyle konuşurken, gezgin satıcı sorunu ortaya çıkar. Belirli sayıda şehir arasındaki olası en kısa rotayı hesaplamaya çalıştığınız ünlü bir bilmecedir, ancak aynı zamanda bilgisayarların işlemlerini nasıl yaptığını düşünmek için zengin bir metafordur.

“Bana dünyadaki tüm makineleri verseydin, oldukça büyük örnekleri çözebilirdim” diyor Raghavan. Ancak arama için, çözülmediğini ve belki de üzerine daha fazla bilgisayar atılarak çözülemeyeceğini söylüyor. Bunun yerine, Google’ın gerçekçi bir şekilde oluşturabileceği kaynaklardan daha iyi yararlanan MUM gibi yeni yaklaşımlar bulması gerekiyor. “Bana mevcut tüm makineleri vermiş olsaydınız, hala insan merakı ve bilişiyle sınırlı kalırım.”

Google’ın bilgiyi anlamanın yeni yolları etkileyici, ancak zorluk, bilgiyle ne yapacağıdır. ve nasıl sunacağını. Gezgin satıcı sorunuyla ilgili komik olan şey, kimsenin durup kasanın tam olarak ne olduğunu, kapı kapı dolaşırken tüm müşterilerine ne gösterdiğini sormamasıdır.