ChatGPT ile sesli ve görüntülü iletişim kurmak mümkün olacak

Yapay Zeka alanındaki öncü kuruluşlardan OpenAI, ChatGPT'nin yeni ses ve görüntü yeteneklerini tanıttı. ChatGPT’ye sesli veya görüntülü komutlar gönderme olanağı, servisi daha kullanıcı dostu bir arayüzle buluşturacak ve böylece OpenAI, kullanıcı merkezli ve interaktif bir platform kurma yolunda ilerlemiş olacak. Konuyu Radyo Sputnik’teki Hafta Sonu Halleri’nde tüm detaylarıyla masaya yatırdık.

Yapay Zeka alanındaki öncü kuruluşlardan OpenAI’ın en bilinen ürünü olan ChatGPT, yeni ses ve görüntü yetenekleriyle daha etkileşimli kullanılabilecek. Mesela, seyahat halindeyken bir tarihi yapıyı veya eseri fotoğraflayıp hakkında interaktif bir sohbet başlatmak artık mümkün. Ya da akşam yemeği için öneri almak adına mutfaktaki dolap ve kilerin fotoğraflarını çekip göndermek yeterli olacak. ChatGPT'yle sesli etkileşim, birçok yeni olanak sunacak. Bir çocuğa masal anlatılması veya yemek masasındaki bir teknik tartışma için görüş alınması artık gerçekleştirilebilecek.

Telefon uygulamalarında daha fazla seçenek var

Bu gelişmiş özellikler, iOS ve Android'de ses, diğer tüm platformlarda ise görüntü özelliğiyle kullanılabilecek ve ChatGPT Plus ve Enterprise kullanıcılarına iki hafta içinde sunulacak. OpenAI, bu yetenekleri, güvenliği sağlamak amacıyla belirli kullanım durumları ve iş birlikleri çerçevesinde sınırlayacak. Bu gelişmiş yetenekler, ChatGPT'nin kullanıcılara daha çeşitli hizmetler sunmasını sağlayacak. Örneğin, kullanıcılar ChatGPT'ye bir ya da daha fazla görüntü göndererek göstermek üzere kullanabilecekler.

Bu yeni yetenekler, ChatGPT’nin görüntü, belge ve sesli yanıtlar aracılığıyla daha derin anlayışlar elde etmesine izin verecek ve kullanıcıların günlük hayatlarında daha yararlı hale gelecek. OpenAI, gelişmiş modellerin potansiyel risklerini azaltmak ve kullanıcılara daha robust sistemlere adaptasyon olanağı sağlamak için bu yeni yetenekleri aşamalı olarak sunmayı amaçlıyor. Ayrıca, OpenAI, ChatGPT’nin görüntü analizi ve sesli yanıt yetenekleri konusunda, gerçek dünya uygulamaları ve geri bildirimlere dayalı olarak güvenlik tedbirlerini optimize etmeyi hedefliyor.

Bu yeni özellikler, ChatGPT'nin metin, görüntü, ses, yazılım ve diğer dijital medyayı üretebilmesine olanak tanıyor. Ayrıca, OpenAI'nin yeni versiyonu DALL-E 3, önceki versiyonlarına göre daha gerçekçi görüntüler üretebiliyor ve harfler, sayılar ve insan eli içeren görüntüler için özel bir beceri gösteriyor. DALL-E 3, kullanıcıların sadece görmek istedikleri şeyi tarif ederek dijital görüntüler üretebilmelerine olanak tanıyor. OpenAI, bu teknolojiyi güvenli bir şekilde kullanabilmek için çeşitli güvenlik önlemleri alıyor ve potansiyel olarak sorunlu içeriği engellemeyi planlıyor.

Görsel yaratma uygulaması DALL-E de artık ChatGPT’de

OpenAI ayrıca DALL-E 3'ü küçük bir test grubu için yayımladı ve bu teknolojiyi ChatGPT'ye ekledi. Çok paragraflı açıklamalardan görüntüler üretebiliyor ve belirtilen talimatları en ince ayrıntısına kadar takip edebilen DALL-E 3, aylık 20 dolar olan ChatGPT Plus aracılığıyla kullanılabilecek.

Uzmanlar, görüntü üreten teknolojinin internette büyük miktarda dezenformasyon yaymak için kullanılabileceği konusunda uyarıda bulunuyor. OpenAI, DALL-E 3 ile cinsel içerikli görüntüler ve kamuya mal olmuş kişilerin tasvirleri gibi sorunlu konuları önlemek için tasarlanmış araçlar kullanıyor.

DALL-E 3 ile çok daha iyi görseller oluşturmak mümkün

DALL-E 3, gerçek bir fotoğraf olmaktan çok, stilize görüntüler üretme eğiliminde. OpenAI, bu yeni özellikleri kademeli olarak sunmayı planlıyor ve modelin güvenlik kameraları tarafından çekilen grenli görüntüler gibi ikna edici sahneler üretmesinin istenebileceğini kabul ediyor.

Bu ek bilgiler ışığında, ChatGPT'nin yeni özellikleri ve DALL-E 3'ün getirdiği inovasyon, kullanıcıların sadece metin tabanlı değil, aynı zamanda görsel içerik üretme konusunda da daha fazla esneklik kazanmalarını sağlıyor. OpenAI'ın bu teknolojik gelişmeleri, yapay zeka alanında önemli bir adım olarak görülebilir ve kullanıcıların günlük yaşamlarında daha faydalı olabilir.

Bununla birlikte, bu tür teknolojilerin dezenformasyon ve yanıltıcı içerik üretme potansiyeli, etik ve güvenlik konularını gündeme getiriyor. OpenAI, bu riskleri minimize etmek ve kullanıcılarına güvenli bir deneyim sunmak için çeşitli önlemler alıyor.