最奇怪的相機(jī):拍出來的是文字
2021-02-28
4253
0
我們之前都喜歡說,一張照片抵過千言萬語,但是世界上總不乏反其道而行之的牛人,這款出自技術(shù)愛好者馬特·理查森(Matt Richardson)之手的奇特相機(jī),設(shè)計初衷就是,如何讓20個字來描述一張照片。 這款相機(jī)目前被稱為“白描相機(jī)(Descriptive Camera)”,使用一張文字描述的打印字條來取代實際拍攝的圖像。 看到這里,你的腦海中蹦出了怎樣的技術(shù)手段,實現(xiàn)場景到文字描述的轉(zhuǎn)換技術(shù)呢?人工智能?機(jī)器學(xué)習(xí)?? ? 其實都不是,這個描述的過程是完全人工實現(xiàn)的。用戶手中的這款相機(jī),目前的模型是配備有網(wǎng)絡(luò)攝像頭的,拍攝的過程與普通相機(jī)無異,手指輕觸拍攝鍵,也會得到一副“看不到的圖像”, 被直接上傳到亞馬遜網(wǎng)站提供的“人工外包服務(wù)站”——土耳其機(jī)器人(Mechanical Turk),只要有人針對照片寫下描述性的語言并且提交回送到相機(jī)客戶端, 相機(jī)就能夠用自帶的熱敏打印機(jī)將其打印出來,如圖所示的輸出結(jié)果。 為了確保結(jié)果的有效性,返回相機(jī)之前增設(shè)了人工篩選過程,最佳描述者會獲得金錢上的支付,而最吻合真實場景的描述才會返回到相機(jī)用戶端。 據(jù)統(tǒng)計,整個過程中,結(jié)果均會在6分鐘內(nèi)返回,多數(shù)情況下可以達(dá)到3分鐘的反饋速度。 我們來看看相機(jī)拍攝的結(jié)果,上圖中,相機(jī)捕捉到窗外強(qiáng)烈日光下一幢高樓的照片, 輸出結(jié)果為:“這是一幢陳舊老樓的照片,它看起來像是風(fēng)燭殘年搖搖欲墜,急需盡快修葺。 (This is a faded picture of a dilapidated building. It seems to be run down and in need of repairs.)” 如上圖,那些黑色方格的不明物體很難辨別,有人提供描述結(jié)果為:“這像是一排又老又丑的櫥柜,其上還貼著各種老舊商標(biāo),殘破不堪。 櫥柜前方有一個臺燈與其相連(Looks like a cupboard which is ugly and old having name plates on it with a study lamp attached to it.” 在這兩張照片中,畫面主體都比較突出,描述起來誤差不大。如何處理這樣的照片,得到用戶滿意的結(jié)果,或許是該款相機(jī)面臨的挑戰(zhàn)。 設(shè)計者理查森介紹說:“這款相機(jī)的實現(xiàn)其實是拋磚引玉的一個探索,在圖像的搜索技術(shù)迫在眉睫的時候,我想知道如果一款相機(jī)能夠及時提供‘可供搜索’的描述性語言,會得到怎樣的成效。” 這款相機(jī)目前還沒有明確標(biāo)價,理查森稱,相機(jī)的硬件成本約為200美元,但是為其編寫代碼也花費(fèi)了很多的時間。 同時,在土耳其機(jī)器人服務(wù)中,每條有效信息為1.25美元。由此估算出來,最終每張照片的成像價格大概與寶麗來相片不相上下。 同時,理查森于今年春季在紐約大學(xué)開設(shè)了一門叫做“計算型相機(jī)(computational cameras)”的課程,他帶著這臺相機(jī)走上課堂,希望能夠教學(xué)相長,為下一步的設(shè)計提供更多想法。 該相機(jī)將于5月14日-15日兩天在紐約的ITP春季展中展出。(文/果殼網(wǎng))