時間:2022-08-25 12:46:07
作者:阿明
瀏覽: 次
計算機視覺的飛速發展離不開大量圖像標注數據的支撐,隨著各類圖像檢測、識別算法的商業化落地,市場對圖像標注精準度愈發嚴格,同時針對不同的應用場景,也衍生出了不同的圖像標注方法。
今天景聯文科技給大家介紹10種常見的圖像數據標注方法及其應用。
語義分割是指根據物體的屬性,對復雜不規則圖片進行進行區域劃分,并標注對應上屬性,以幫助訓練圖像識別模型,常應用于自動駕駛、人機交互、虛擬現實等領域。什么是語義標注?五大標注步驟
矩形框標注又叫拉框標注,是目前應用最廣泛的一種圖像標注方法,能夠以一種相對簡單、便捷的方式在圖像或視頻數據中,迅速框定指定目標對象。
多邊形標注是指在靜態圖片中,使用多邊形框,標注出不規則的目標物體,相對于矩形框標注,多邊形標注能夠更精準地框定目標,同時對于不規則物體,也更具針對性。多邊形標注的特點與應用
關鍵點標注是指通過人工的方式,在規定位置標注上關鍵點,例如人臉特征點、人體骨骼連接點等,常用來訓練面部識別模型以及統計模型。
點云是三維數據的一種重要表達方式,通過激光雷達等傳感器,能夠采集到各類障礙物以及其位置坐標,而標注員則需要將這些密集的點云分類,并標注上不同屬性,常應用于自動駕駛領域。自動駕駛:Lidar 3D點云數據標注
與點云標注不同,3D立方體標注還是基于二維平面圖像的標注,標注員通過對立體物體的邊緣框定,進而獲得滅點,測量出物體之間的相對距離。
2D/3D融合標注是指同時對2D和3D傳感器所采集到的圖像數據進行標注,并建立關聯。該方法能夠標注出物體在平面和立體中的位置和大小,幫助自動駕駛模型增強視覺和雷達感知。
目標追蹤是指在動態的圖像中,進行抽幀標注,在每一幀圖片中將目標物體標注出來,進而描述它們的運動軌跡,這類標注常應用于訓練自動駕駛模型以及視頻識別模型。
OCR轉寫是對圖像中的文字內容進行標記與轉寫,幫助訓練和完善圖片與文本識別模型。目前,景聯文支持簡體中文、繁體中文、英語、日語、韓語、法語、德語、西班牙語、阿拉伯語等十余種語言印刷或手寫圖片的轉寫。
屬性判別是指通過人工或機器配合的方式,識別出圖像中的目標物體,并將其標注上對應屬性。
景聯文科技(全稱杭州景聯文科技有限公司)成立于2012年04月24日,主營業務為數據采集標注服務和指紋防偽算法。
在指紋技術領域,景聯文持有多項自主知識產權專利及軟件著作權,曾在2017年、2019年連續兩屆拿下LivDet:Fingerprint Liveness Detection Competition(國際活體指紋檢測大賽)第一名;參與編撰工信部生物識別行業發展白皮書《生物特征識別白皮書(2019版)》。
2016年,景聯文科技基于原指紋采集業務,全面拓展為AI基礎數據服務,向科技公司、AI企業、人工智能算法模型提供高質量、場景化數據。
經過數年積累,目前,景聯文在全國范圍內擁有5個標注基地,220名全職人工智能訓練師,文本、語音、圖像、視頻現有數據庫超300TB;并于2020年上線了自有標注平臺,涵蓋了絕大多數主流標注工具,支持語義分割、拉框標注、多邊形標注、關鍵點標注、3D點云、2D3D融合標注、圖片分類、聲紋識別、ASR轉寫、韻律標注、NLP、文本分類、OCR轉寫、情緒判斷等多種標注業務。
截至目前,景聯文科技已與阿里巴巴、華為、vivo、美團、字節跳動、滴滴、陌陌、??低?、大華、宇視、同濟大學、中國人民大學、工信部中國電子技術標準化研究院、公安部一所等多家企業、機構達成深入合作。