1. Anasayfa
  2. Haberler
  3. Teknoloji Devleri

Manus Yeni Nesil Yapay Zeka Ajanı

Manus Yeni Nesil Yapay Zeka Ajanı
0

Yapay zeka dünyasında son günlerde herkes Manus ‘tan bahsediyor. Çin merkezli bu yeni yapay zeka ajanını test ettik ve sonuçları sizlerle paylaşıyoruz.

Manus Nedir?

Wuhan merkezli Butterfly Effect şirketi tarafından geliştirilen ve geçen hafta piyasaya sürülen Manus, sadece Çin’de değil, tüm dünyada büyük bir ilgi gördü. Twitter’ın kurucu ortağı Jack Dorsey ve Hugging Face ürün lideri Victor Mustar gibi teknoloji dünyasının önemli isimleri performansını övdü. Bazıları Manus’u, beklenmedik yetenekleri ve kökeniyle sektörü şaşırtan bir önceki yapay zeka modeli DeepSeek’e benzetip “ikinci DeepSeek” olarak adlandırdı.

Manus, kendisini dünyanın ilk genel yapay zeka ajanı olarak tanımlıyor. Anthropic’in Claude 3.5 Sonnet ve Alibaba’nın açık kaynaklı Qwen modelinin özelleştirilmiş versiyonları gibi çoklu yapay zeka modellerini kullanarak çok çeşitli görevlerde otonom olarak hareket edebiliyor. Bu özellik, onu tek bir büyük dil modeli ailesine dayalı ve öncelikle konuşma etkileşimleri için tasarlanmış yapay zeka sohbet robotlarından (DeepSeek dahil) farklı kılıyor.

Kullanım Deneyimi

MIT Technology Review, Manus’a erişim elde edebilen az sayıdaki kullanıcıdan biri oldu (bekleme listesindeki kullanıcıların %1’inden azı davet kodu almış durumda).

Manus’u kullanmak, zeki ve verimli bir stajyerle işbirliği yapmaya benziyor: Bazen ne yapması istendiğini tam olarak anlamayabiliyor, yanlış varsayımlarda bulunabiliyor veya görevleri hızlandırmak için kestirme yollara başvurabiliyor. Ancak düşünce sürecini net bir şekilde açıklıyor, son derece uyarlanabilir ve ayrıntılı talimatlar veya geri bildirimler sağlandığında önemli ölçüde gelişebiliyor.

Manus’un arayüzü, ChatGPT veya DeepSeek’e benzer şekilde temiz ve minimalist bir tasarıma sahip. Önceki oturumlar sol sütunda görüntüleniyor ve ortada bir sohbet giriş kutusu bulunuyor. Ana sayfa ayrıca, iş stratejisi geliştirmeden etkileşimli öğrenmeye ve özelleştirilmiş ses meditasyon oturumlarına kadar uzanan, şirket tarafından düzenlenmiş örnek görevleri de içeriyor.

Manus ‘un Ayırt Edici Özellikleri

ChatGPT DeepResearch gibi diğer akıl yürütme tabanlı ajan yapay zeka araçları gibi, Manus da görevleri adımlara ayırabiliyor ve bu görevleri tamamlamak için ihtiyaç duyduğu bilgileri elde etmek üzere internette otonom olarak gezinebiliyor. Onu farklı kılan, “Manus’un Bilgisayarı” penceresi. Bu pencere, kullanıcılara sadece ajanın ne yaptığını gözlemleme imkanı vermekle kalmıyor, aynı zamanda herhangi bir noktada müdahale etme fırsatı da sunuyor.

Test Sonuçları

MIT Technology Review ekibi, Manus’a üç görev verdi:

  1. Çin teknolojisini kapsayan önemli gazetecilerin bir listesini derlemek
  2. New York’ta iki yatak odalı mülk ilanlarını aramak
  3. MIT Technology Review’in her yıl oluşturduğu 35 Yaş Altı Yenilikçiler listesi için potansiyel adaylar önermek

Gazeteci Listesi Görevi

Manus, başlangıçta sadece beş isim ve beş “onursal mansiyondan” oluşan kısıtlı bir liste sundu. Bazı gazetecilerin önemli çalışmalarını belirtirken diğerleri için bunu yapmadığı gözlemlendi. Manus’a sorulduğunda, basit bir nedenle açıkladı: “Üşenmiş”. Araştırma sürecini hızlandırmaya çalıştığı için zaman kısıtlaması yaşadığını belirtti. Tutarlılık ve derinlik talep edildiğinde, Manus 30 gazetecinin mevcut yayın organı ve önemli çalışmalarını listeleyen kapsamlı bir yanıt verdi.

Gerçek hayattaki bir stajyer veya asistanla olduğu gibi, üst düzey değişiklik önerileri yapabilmek ve bunların uygun şekilde yanıtlanması etkileyiciydi. Ayrıca, sonuçları Word veya Excel dosyası olarak indirme imkanı, düzenlemeyi veya başkalarıyla paylaşmayı kolaylaştırdı.

Ancak Manus, gazetecilerin ücretli abonelik gerektiren haber makalelerine erişimde sorun yaşadı; sıklıkla captcha engelleriyle karşılaştı. Kullanıcı adım adım takip edebildiği için, bu tür kısıtlamalarla karşılaşıldığında proaktif olarak yardım isteyebilen gelecek bir Manus versiyonu faydalı olacaktır.

Manus Daire Arama Görevi

Daire araması için, Manus’a bütçe ve çeşitli parametreler içeren karmaşık bir kriter seti verildi: geniş bir mutfak, açık alan, Manhattan merkeze erişim ve yedi dakikalık yürüme mesafesinde büyük bir tren istasyonu. Manus başlangıçta “bir tür açık alan” gibi belirsiz gereksinimleri fazla literal yorumladı ve özel teras veya balkon erişimi olmayan mülkleri tamamen dışladı. Ancak, daha fazla rehberlik ve açıklama sonrasında, daha geniş ve daha yararlı bir liste derleyebildi.

Nihai çıktı, “genel olarak en iyi”, “en iyi değer” ve “lüks seçenek” gibi alt başlıklarla, düzenli maddeler halinde öneriler içeriyordu. Bu görev (karşılıklı yazışmalar dahil) yarım saatten az sürdü – muhtemelen emlak ilanlarının internette daha açık ve iyi yapılandırılmış olması nedeniyle, gazetecilerin listesini derlemekten (biraz daha uzun süren) çok daha az zaman aldı.

35 Yaş Altı Yenilikçiler Listesi Görevi

Bu, en kapsamlı görevdi: Manus’tan bu yılki 35 Yaş Altı Yenilikçiler listesi için 50 kişi önermesi istendi. Manus, görevi adımlara ayırdı: seçim kriterlerini anlamak için geçmiş listeleri incelemek, adayları belirlemek için bir arama stratejisi oluşturmak, isimleri derlemek ve dünyanın her yerinden çeşitli adayların seçilmesini sağlamak.

Arama stratejisi geliştirmek, Manus için en fazla zaman alan kısım oldu. Yaklaşımını açıkça belirtmese de, “Manus’un Bilgisayarı” penceresi, ajanın prestijli araştırma üniversitelerinin web sitelerinde, teknoloji ödülleri duyurularında ve haber makalelerinde hızla gezindiğini ortaya koydu. Bununla birlikte, akademik makalelere ve ücretli medya içeriğine erişmeye çalışırken yine engellerle karşılaştı.

İnternette üç saatlik bir araştırmanın ardından – ki bu süre zarfında Manus (anlaşılır bir şekilde) aramayı daraltıp daraltamayacağımı birkaç kez sordu – tam arka plan profilleriyle sadece üç aday verebildi. 50 isimlik eksiksiz bir liste sunması için tekrar ısrar edildiğinde, sonunda bir liste oluşturdu, ancak belirli akademik kurumlar ve alanlar, eksik bir araştırma sürecini yansıtacak şekilde aşırı temsil ediliyordu.

Genel Değerlendirme

Manus, kodlama geçmişi olan veya olmayan kullanıcılar için son derece sezgisel bir araç. Üç görevden ikisinde, ChatGPT DeepResearch’ten daha iyi sonuçlar sağladı, ancak bunları tamamlamak önemli ölçüde daha uzun sürdü. Manus, açık internette kapsamlı araştırma gerektiren ancak sınırlı kapsamı olan analitik görevler için en uygun görünüyor. Başka bir deyişle, yetenekli bir insan stajyerin bir günlük çalışma sırasında yapabileceği türden işlere odaklanmak en iyisi.

Ancak her şey sorunsuz değil. Manus, sık sistem çökmelerinden ve sistem kararsızlığından muzdarip olabiliyor ve büyük metin parçalarını işlemesi istendiğinde zorlanabiliyor. Yeni istekler başlatmaya çalışırken “Mevcut yüksek hizmet yükü nedeniyle görevler oluşturulamıyor. Lütfen birkaç dakika sonra tekrar deneyin” mesajı ekranda birkaç kez görüntülendi ve zaman zaman “Manus’un Bilgisayarı” belirli bir sayfada uzun süre dondu.

ChatGPT DeepResearch’ten daha yüksek bir başarısızlık oranına sahip – Manus’un baş bilim insanı Peak Ji’ye göre ekibin üzerinde çalıştığı bir sorun. Bununla birlikte, Çin medya kuruluşu 36Kr, Manus’un görev başına maliyetinin yaklaşık 2 dolar olduğunu bildiriyor. Bunun da DeepResearch maliyetinin sadece onda biri olduğunun altını çiziyor. Manus ekibi sunucu altyapısını güçlendirirse, özellikle beyaz yakalı profesyoneller, bağımsız geliştiriciler ve küçük ekipler olmak üzere bireysel kullanıcılar için tercih edilen bir araç haline gelebilir.

Manus Çalışma Süreci

Manus’un çalışma sürecinin nispeten şeffaf ve işbirlikçi olması oldukça değerli. Yol boyunca aktif olarak sorular soruyor. Temel talimatları gelecekte kullanılmak üzere “bilgi” olarak hafızasında tutuyor, böylece kolayca özelleştirilebilir bir ajan deneyimi sunuyor. Ayrıca, her oturumun yeniden oynatılabilir ve paylaşılabilir olması da çok güzel.

MIT Technology Review ekibi, Manus’u hem kişisel hem de profesyonel yaşamda çeşitli görevler için kullanmaya devam etmeyi planlıyor. DeepSeek ile karşılaştırmaların tam olarak doğru olup olmadığından emin değiler. Çinli yapay zeka şirketlerinin sadece Batılı meslektaşlarının izinden gitmediğini biliyoruz. Aksine otonom yapay zeka ajanlarının benimsenmesini kendi yollarıyla aktif olarak şekillendirdiklerinin kanıtı olarak değerlendiriyorlar.

Bu yeni teknoloji, hem bireysel kullanıcılar hem de küçük işletmeler için yapay zeka destekli asistanların geleceğine dair heyecan verici bir bakış sunuyor.

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir