Botë e Çuditshme Tech

Aparati që i shndërron fotografitë në poezi!

Risitë që lindin në botën e teknologjisë AI nuk kanë vërtet fund. Përveç shkrimit të emaileve të përditshme dhe kryerjes së detyrave të tjera, AI tani mund të bëjë fotografitë “të flasin dhe të këndojnë”, të parashikojnë veprimet e ardhshme njerëzore, të konkurrojnë dhe të gjykojnë në garat e AI dhe madje të rikrijojnë teknologjinë Star Trek.

Kelin Carolyn Zhang dhe Ryan Mather bashkëpunuan për të zhvilluar pajisjen ‘Poetry Camera’, një projekt me burim të hapur që ndërthur teknologjinë me shpirtin artistik, duke rezultuar në një krijim që i kapërcen kufijtë e të dy fushave. Poetry Camera i ngjan një aparati tipik Polaroid, por në vend që të bëjë fotografi, kjo pajisje e transformon hyrjen vizuale në poezi ndjellëse që përshkruajnë gjallërisht skenën e regjistruar.

Pajisja mundësohet nga një kompjuter Raspberry Pi dhe gjithashtu përdor modelin GPT-4 nga OpenAI, kështu që përfaqëson një kombinim të harduerit dhe inteligjencës artificiale. Raspberry Pi përpunon imazhet e kapura, nxjerr të dhëna vizuale dhe i transmeton ato te komponenti i AI. Moduli i AI-së analizon më pas aspekte të ndryshme të fotografisë duke përfshirë ngjyrat, modelet, elementet domethënëse dhe madje edhe emocionet që transmetohen.

Rikujtojmë se Nuca është një fotoaparat i cili çdo fotografi në të cilën gjendet një person, mund ta shndërrojë në përmbajtje ‘eksplicite’. Prototipi aktual Nuca është një aparat fotografik i printuar 3D me një lente me kënd të gjerë 37 mm. Kur krijon një foto, e dërgon atë në një server që përdor një klasifikues të krijuar nga Vef dhe Groß, i cili analizon imazhin për të përshkruar subjektin në tekst; gjininë, moshën dhe racën.

Ai tekst përdoret më pas për të gjeneruar një kërkesë që futet në gjeneratorin e imazhit të Stable Diffusion AI, për të kthyer tekstin në një imazh, i cili së bashku me modelin Civitai përdoret për të prodhuar trupin e zhveshur. Kamera përdor gjithashtu një mjet të ndërrimit të fytyrës me burim të hapur, për të shtuar një fytyrë nga një foto në imazhin e krijuar nga AI me vetëm një klik.