Teknoloji

Yapay zeka tarafından üretilen görüntüler ve videolar ile araştırmalar nasıl şekillendirilebilir?

Yayınlandı -

/

Metin açıklamalarını görüntülere ve videolara çeviren yapay zeka (YZ) araçları hızla ilerliyor. Birçok araştırmacının bilimsel yazım sürecini dönüştürmek için ChatGPT’yi kullanması gibi, diğerleri de diyagram ve illüstrasyon üretmek için gereken zaman ve çabayı azaltmak için Midjourney, Stable Diffusion ve DALL-E gibi AI görüntü oluşturucuları kullanıyor. Ancak araştırmacılar, bu yapay zeka araçlarının sahte verilerin ve yanlış bilimsel görüntülerin artmasına neden olabileceği konusunda uyarıyor.

Nature, araştırmacıların bu araçları nasıl kullandıklarını ve artan popülerliklerinin bilim için ne anlama gelebileceğini inceliyor.

Midjourney ve DALL-E gibi birçok metinden görüntüye yapay zeka aracı, internetten toplanan milyonlarca görüntü ile bu görüntülerin metin açıklamaları arasındaki bağlantıları tanımak üzere eğitilen ve difüzyon modelleri adı verilen makine öğrenimi algoritmalarına dayanmaktadır. Bu modeller, donanımdaki gelişmeler ve eğitim için büyük veri setlerinin kullanılabilirliği sayesinde son yıllarda gelişmiştir. Eğitimden sonra, difüzyon modelleri yeni görüntüler oluşturmak için metin istemlerini kullanabilir.

Bazı araştırmacılar, bilimsel makalelerdeki yöntemleri göstermek için yapay zeka tarafından oluşturulan görüntüleri zaten kullanıyor. Diğerleri ise bunları sosyal medya paylaşımlarında makaleleri tanıtmak veya sunum slaytlarını renklendirmek için kullanıyor. Kanada, Montreal’deki ServiceNow Research’te çalışan yapay zeka araştırmacısı Juan Rodriguez, “Araştırma konseptlerini çerçevelemek için güzel görünümlü görüntüler oluşturmak için DALL-E 3 gibi araçlar kullanıyorlar” diyor. “Geçen Perşembe günü çalışmam hakkında bir konuşma yaptım ve insanların dikkatini çekmek için çekici görüntüler oluşturmak üzere DALL-E 3’ü kullandım” diyor.

Rodriguez, metinden videoya araçlarının da yükselişte olduğunu, ancak bu araçları aktif olarak geliştirmeyen veya üzerinde çalışmayan araştırmacılar tarafından daha az kullanıldığını söylüyor. Ancak bu durum yakında değişebilir. Geçtiğimiz ay, San Francisco, Kaliforniya’daki ChatGPT yaratıcısı OpenAI, Sora adlı bir metinden videoya aracı tarafından oluşturulan video klipleri yayınladı. Rodriguez, “Sora ile gördüğümüz deneylerde, yöntemlerinin hızlı sonuç alma konusunda çok daha sağlam olduğu görülüyor” diyor. “Metinden videoya açısından henüz erkenciyiz ama sanırım bu yıl bunun nasıl geliştiğini göreceğiz” diye ekliyor.

Üretken YZ araçları, makaleler, konferans posterleri veya sunumlar için görüntü veya şekil üretmek için harcanan süreyi azaltabilir. Geleneksel olarak araştırmacılar PowerPoint, BioRender ve Inkscape gibi bir dizi yapay zeka dışı araç kullanmaktadır. Rodriguez, “Bu araçları nasıl kullanacağınızı gerçekten biliyorsanız, gerçekten etkileyici şekiller yapabilirsiniz, ancak bu zaman alıcıdır” diyor.

Yeni Kitap / D&R

Rodriguez, yapay zeka araçlarının bilimsel kavramları görsel araçlara dönüştürmekte zorlanan araştırmacılar için görüntü kalitesini de artırabileceğini söylüyor. Üretken yapay zeka ile araştırmacılar hala görüntü için üst düzey bir fikir buluyorlar, ancak bunu iyileştirmek için yapay zekayı kullanabiliyorlar, diyor.

Trend

Exit mobile version