Konuşan Tur Rehberi Robot Köpek

28
Konuşan Tur Rehberi Robot Köpek


Teknolojinin bilim kurgu alanına atfedilen gelişmelerinin günlük haber başlıklarına dönüştüğü bir dönemde, Boston Dynamics bir kez daha sınırları zorluyor. Artık sadece robotların yürüme veya sıçrama yetenekleri değil, aynı zamanda iletişim kurma yetenekleri de söz konusu.

Ünlü robot köpek Spot’u hayal edin; oynamaya uygun bir şapka, bıyık ve o unutulmaz gözlerle donatılmış olarak, şirketin tesislerindeki personeli yönlendiriyor. Ve bununla da yetinmeyip İngiliz aksanıyla neşeli diyaloglara giriyor. Bu sadece mühendislik bir başarısı değil; insanlarla makineler arasındaki evrilen ilişkinin simgesel bir göstergesi. Teknoloji, kararlı ilerleyişini sürdürdükçe, insan etkileşimleri ile makine diyalogları arasındaki çizgi giderek belirsizleşiyor.

Rehber Spot

“Yolculuğumuza başlayalım mı?” diyor Spot. “Şarj istasyonları, Spot robotlarının dinlendiği ve şarj olduğu yer, ilgi alanımızın ilk noktası. Beni takip edin, beyefendiler.” Gösteri, Spot’un konuşmalara katılım becerilerini vurguluyor; hatta “ağzını” konuşmasıyla senkronize bir şekilde hareket ettirerek gerçek konuşma izlenimi yaratıyor.

Spot’a konuşma yeteneği kazandırmak için Boston Dynamics, OpenAI’nın ChatGPT API’sının gücünden yararlandı. Ayrıca, açık kaynaklı büyük dil modellerini (LLM) entegre ederek açıklayıcı yanıtlarını geliştirmek için fine-tune ettiler. Daha sonra robota bir hoparlör sistemi eklediler ve metinden sese özellikleri gömme işlemi yaptılar. Son dokunuş, gripper’ını – yarıyani “ağzı” – kelimelerle ahenk içinde hareket ettirmek oldu, adeta bir kuklacı kuklasını canlandırır gibi.

Boston Dynamics’te baş yazılım mühendisi olan Matt Klingensmith, benimsedikleri yaklaşımı açıklıyor. Ekip, Spot’a tesislerindeki her özel odaya uygun kısa bir senaryo sağladı. Spot daha sonra bu senaryoyu, gripper’ı ve çerçevesinde bulunan entegre kameraların görsel beslemeleri ile birleştirdi. Bu sinerji, Spot’un çevresini daha iyi yorumlamasına olanak tanıyarak daha bağlam odaklı yanıtlar vermesine neden oldu. Spot’un çevresini çözümleyip uygun şekilde yanıt verme yeteneği, temelde görüntülere açıklamalar sağlayan ve sorgulandığında cevaplar sunan Görsel Soru Cevaplama modellerine atfedilmektedir.

Yaşanan zorluklar

Ancak, videoda dikkat çeken ve gerçek zamanlı yapay zeka etkileşimlerinin zorluklarına bir pencere açan bir an vardı. Klingensmith, Spot’un sohbet tarzından etkilenmiş gibi görünerek aksanını övdü. Ancak, Spot, turu yönlendirmeye dalmış gibi görünerek, “Şimdi kalibrasyon panosuna doğru ilerleyelim, değil mi? Yakın kalın.” dedikten sonra sadece bu cümle sona erdikten sonra, belki de iltifatı işleyerek ve ardından bir yanıt sunarak durdu.

Bu küçük aksaklık, Spot gibi bir yapay zeka sisteminin sürekli olarak gezinmesi gereken önceliklerin karmaşık dansını ortaya koymaktadır. Gerçek zamanlı işleme, yapay zekanın görevlere öncelik vermesini gerektirir ve bazen senaryo tabanlı veya önceden programlanmış eylemler, anlık etkileşimlere öncelik tanıyabilir.

Başka bir olasılık, özellikle beklenmeyen veya senaryo dışı olduklarında dış girişleri işlemedeki doğal gecikmedir. Yapay zeka modelleri, özellikle LLM’ler gibi karmaşık olanlar, uygun bir yanıt üretebilmek için geniş veri setlerini işlemeli ve bunları eğitilmiş veri setleriyle karşılaştırmalıdır.

Ayrıca, Spot gibi makinelerin giderek daha karmaşık hale geldiği bir gerçeği hatırlatır. Ancak bunların kusursuz olmadığını da unutmamak önemlidir. Bu makinelerin eylemleri, özenle tasarlanmış algoritmalar, geniş veri setleri ve önceden belirlenmiş önceliklerin bir sonucudur. Bu sistemler bazen insan etkileşimlerinin inceliklerini atlayabilir veya bunları işlemek için ek bir süreye ihtiyaç duyabilir.

Yapay zeka devam ettikçe, bu tür küçük ancak fark edilebilir zorlukları ele almak, sorunsuz insan-makine etkileşimlerini sağlamak için kritik olacaktır.

Çoklu avatar

Boston Dynamics, Spot’un rehberliğindeki yolculuğun aydınlatıcı anlarla dolu olmadığını paylaşıyor. Takım, Spot’un “ebeveynleri” hakkında bir soru sorduğunda, robot zekice şirketin sergi alanında sergilenen eski Spot iterasyonlarına gitti. Ancak tıpkı tüm yapay zeka gibi, hatalı anlar da vardı. Örneğin, Stretch’e, Boston Dynamics’in kutu manipülasyon robotuna atıfta bulunurken, LLM’nin işlevini mizahi bir şekilde yanlış yorumladı ve yoga egzersizleri için tasarlandığını öne sürdü.

Spot robot köpek

Klingensmith, Boston Dynamics’in platformuyla ilgili bir düşünce parçasında, “Yapay zeka ve robotik alanındaki kesişimi keşfetmeye devam etmekten heyecan duyuyoruz.” diyor. LLM’lerin potansiyelini daha da geniş bir kültürel anlayış, sağduyulu düşünce ve sayısız robotik fonksiyonda değerli olabilecek uyum kabiliyeti ile donatma potansiyeli üzerinde daha fazla konuşuyor. Bahsettiği etkileyici bir olasılık, bir robotu sadece konuşma yoluyla talimatlandırma olasılığıdır, bu da onların benimsenmesini daha sorunsuz hale getirebilir.

Ancak Spot’un sunumundaki whimsical (ciddiyetsiz, mizahi) tonlara rağmen, daha pragmatik yeteneklerini göz ardı etmemek önemlidir. Spot’un kapı operasyonları ve gözetim gibi aktivitelerdeki yetenekleri, özellikle kolluk kuvveti ve askeri operasyonlarda uygulamalarını düşündüğümüzde oldukça etkili hale gelir.

Bir yanıt yazın