【超級筍工】29歲碩士生成「吻戲鑒定師」,認得500個明星就做得?
職業百百種,但你有聽過「吻戲鑒定師」嗎?29歲的吉恆杉就是「吻戲鑒定師」。他坐在電腦前,手指輕輕點擊鼠標,將屏幕上成百上千幅內容各異的畫面標註成兩類 - 「接吻」和「非接吻」作為一名人工智能標註員,他正在訓練機器識別何為「接吻」鏡頭,因此被戲稱為「吻戲鑑定師」。
人工智能和視頻黑科技的應用,不僅提升了用戶觀看體驗,更催生出眾多炫酷的新就業崗位,除了吻戲鑑定師,還有「明星標註師」,「射門投籃視頻分析員」等等......既對娛樂,體育感興趣又精通技術的「程式員」,成為視頻網站最緊缺的人才。
Photo from Internet
如何成為「吻戲鑒定師」?
吉恆杉畢業於北京航空航天大學,碩士學的是計算機視覺,通俗地講,這個專業的目的是「教電腦看懂世界」。「這個崗位給大家傳遞快樂和幸福,又能以工作的名義看網劇綜藝,我特別喜歡。」談起自己的工作,吉恆杉一臉笑容。「剛開始我和女朋友說,我的工作是訓練計算機識別出吻戲鏡頭,她聽完覺得特別不可思議,誰能給錢讓你幹這個呢?」
「吻戲鑒定師」的正式職位名稱是數據標註師。據優酷網的「娛樂數據標註師」招聘廣告顯示,應徵者要同時能夠認出500名以上國內外明星,及分別有500套以上綜藝網劇和電影的觀看量,對娛樂新聞有廣泛了解才合符資格。
Photo from Internet
加上標籤即能加快搜索
十年來,中國大陸的網絡視頻內容消費用戶高達近6億。用戶的需求不再是簡單地看劇,還想更主動地找到自己最想看的明星或場景。要想加快搜索速度和智能編輯,就得訓練機器從海量的素材中找出相應的場景,並打上標籤。男女主角的「吻戲」,一般是劇情發展的高潮,因此成為劇集中最常見的標籤,因此,「如何教機器識別接吻」成了吉恆杉和同事們首要的難題。
這項人工智能,在最初的環節真的需要不少人力。吉恆杉從圖片庫和視頻中截出數千幅圖片,從中一張一張標註出「接吻」的畫面,最多時一天標註上千張。通常數據標註得越準確,數量越多,模型的效果就越好。自然,機器識別的效果就會更好。截止目前,吉恆杉和同事們已經為2萬多場「吻戲」打上了標籤。
Photo from Internet
明星長太相 電腦也面盲
吉恆杉所在的團隊目前有8個人。隨著業務的快速拓展,「吻戲鑑定師」們也開始接觸和研究其他場景,比如哭戲,打戲,接下來還要鑑定體育比賽中的射門,扑球,投籃,慶祝等畫面,以便網站小編製作比賽精彩集錦。他們不光要看圖片,還要時常「探班」,到比賽或節目現場去觀察和體會每個場景,動作的細小差別。
這幾年娛樂圈出現了一些新現象,比如,現在的明星長得越來越像,如何訓練機器識別古力娜扎和迪麗熱巴,如何分辨TFBOYS的三小男孩,需要不斷試錯和反复進行模型訓練。區分「明星臉」,「網紅臉」,「雙胞胎」,成了吉恆杉和同事們面臨的新挑戰。
Text by BusinessFocus Editorial