探秘百度山西数据标注基地:一个标注师一天完成1300多张图片

探秘百度⼭西数据标注基地:⼀个标注师⼀天完成1300多张图⽚
meno2
新基建浪潮下,作为AI原油的数据产业蓬勃⽣长,也催⽣出对“数据标注师”这⼀新职业的⼤量需求,促进就业。7⽉2⽇消息,作为全球领先的AI平台型公司,百度宣布将继续加⼤对新基建数据产业⽅⾯的投⼊,未来5年将在百度⼭西数据标注基地培养5万名AI数据标注师,并引⼊更多AI合作伙伴。百度与⼭西数据标注基地的合作模式,未来还将拓展到更多省市,提供更多的AI就业岗位,⽀持当地科技产业发展。为了了解数据标注产业和“数据标注师”这⼀新兴职业,记者探访了百度(⼭西)⼈⼯智能基础数据产业基地(以下简称百度⼭西数据标注基地)。
“保就业”“稳民⽣”,数据标注提供⼤量岗位
共享空调在基地⾥,数据标注师正坐在电脑前熟练标注肺部影像上的病毒数据,以提⾼⼈⼯智能对病毒的识别能⼒。疫情发⽣以来,他们已标注了数千张这样的肺炎影像图。“平常医⽣看⼀张CT需要⼏分钟的时间,如果⽤我们参与标注的⼈⼯智能算法作为辅助⼿段,⼏秒钟就能初步判断⼀张CT上是否存在疑似病毒。”医疗影像项⽬⼩组长秦美介绍。
(百度(⼭西)⼈⼯智能基础数据产业基地)
据了解,AI数据标注师是随着⼈⼯智能的发展出现的⼀个新兴就业岗位。2020年2⽉,“⼈⼯智能训练
师”正式成为新职业并纳⼊国家职业分类⽬录。数据采集和标注是⼈⼯智能训练师的主要任务之⼀。数据标注师的⼯作是教会AI认识数据,有了⾜够多、⾜够好的数据,AI才能学会像⼈⼀样去感知、思考和决策,更好地为⼈类服务。
疫情期间⼭西数据标注基地还完成了戴⼝罩的⼈脸图像标注,采集⼤量的戴⼝罩的⼈脸照⽚后,数据标注师对⼈脸的眉⽑、眼镜、颧⾻等⼈脸关键点进⾏精准的标注,标注的特征点越多,AI就越能精确地识别戴⼝罩场景下的⼈脸,让⼈们在不摘⼝罩的情况下也能实现精确的体温测量,或是通过⼈脸闸机。
疫情发⽣后,百度公司积极参与科技防疫,⼭西数据标注基地功不可没。今年2⽉3⽇以来,基于百度的云上标注和远程办公,基地1300多⼈线上复⼯,为全国各地多个“科技防疫”项⽬的实施应⽤提供了重要⽀撑,实现产值近2000万元。
在数据标注的⽀持下,百度AI多⼈测温已在全国近百处公共场所落地部署,落地两个⽉内就累计检测2700万⼈次;百度智能外呼平台已在北京海淀区、陕西西安、上海宝⼭等⼗⼏个地区投⼊使⽤,⽀持流动⼈员排查、本地居民排查回访、特定⼈通知三⼤场景的外呼服务;百度携⼿新⽯器推出的⽆⼈智能防疫车,已在武汉、上海、深圳和⼴州等地的重点保护区域和隔离区域进⾏消杀作业。
疫情之下,“保就业”成为中央及地⽅政府⼯作的重中之重。今年的两会政府⼯作报告,39次提及就业,较去年的22次⼤幅增加。数据标注正是促进就业的⼀⼤新兴职业,其技术门槛低,经过⼀定的培训就能上岗,招⼯⼈范围⼴泛。⽽且,数据标注只需要员⼯有电脑就可以在家办公,不容易受到疫情的影响,使得员⼯的收⼊更加稳定,抗风险能⼒提升。
郭梅“再就业”的经历便是⼀个⽣动注脚。例如,34岁的郭梅原本就职于⼭西的传统矿业单位,来到⼭西数据标注基地,经过公司的岗前培训和团队的帮助,⼀开始每天只能标注两三百张,现在提升到每天能完成1300多张,实现了从传统⾏业到新兴⾏业的职业转型。作为数据标注师,她的收⼊也⾼于当地平均收⼊⽔平。
林妙可被毒虫咬伤(数据标注师郭梅)
⼀年半后,郭梅已经掌握了⽆⼈驾驶,⼈脸识别,图像分类,语⾳识别等数据标注的能⼒。作为⼀位
7岁孩⼦的母亲,她对丢失⼉童的家庭的悲凉感同⾝受,她开始理解⼈脸数据标注这份⼯作的意义,在百度AI寻⼈帮助1万个家庭破镜重圆的故事中,也有⾃⼰贡献的⼀份⼒。
“这份⼯作让我觉得可以跟上世界的脚步,距离未来不再那么遥远。”郭梅谈到。
“这份⼯作让我觉得可以跟上世界的脚步,距离未来不再那么遥远。”郭梅谈到。
百度数据标注基地落地⼭西以来,⼀直肩负“保就业”“稳民⽣”的企业社会责任,不断创造新型就业机会,为⾼职⼤专毕业学⽣、部分残障⼈⼠、下岗再就业⼈⼠等提供就业岗位。百度还宣布将在5年内为⼭西提供5万数据标注师就业岗位。
基地约有九成的⼈员为“00后”的⾼职⼤专毕业学⽣,由各标注企业从院校合作招聘过来,部分院校和标注企业形成了校内培训加分配就业的合作,实现了教育链和产业链的有机衔接;另外约⼀成标注⼈员来源于社会招聘,包括部分残障⼈⼠和下岗再就业员⼯。⽬前基地标注⼈员的收⼊⽔平已经⾼于⼭西省的平均收⼊⽔平。
AI新基建助⼒煤炭⼤省向数字经济转型升级
今年全国两会,备受关注的“新基建”⾸次写⼊政府⼯作报告。新基建之新,就在于其是提供数字转型、智能升级、融合创新等服务的基础设施体系,涵盖物联⽹、5G、⼈⼯智能等⽅⽅⾯⾯。⽽这些技
术都离不开数据标注。
所谓“数据标注”就是借助标记⼯具,对数据进⾏加⼯,去教会机器识别数据。⼈⼯智能的三要素中,数据作为基础,⽐算⼒和算法还要重要。数据标注可以说是⼈⼯智能的动⼒和灵魂。
矩阵键盘程序
⼭西是名副其实的煤炭⼤省,然⽽,“⼀煤独⼤”格局也成为⼭西之痛。近年来,⼭西不断发展清洁燃煤技术,并探索打造具有⼭西特⾊的数字经济新⾼地。百度⼭西数据标注基地正是⼭西转型综改⽰范区的重要项⽬。
⽬前,数据标注基地业务全⽅位覆盖了⽆⼈车、语⾳、⼈脸、图像、NLP、地图测绘等数据类型的标注和加⼯处理服务,成为建⽴新兴⼈⼯智能基础设施的底层⽀撑,加速智能交通、智能地图、智慧医疗、智慧城市等领域的智能化升级速度。
从签约⾄今,百度已经帮助⼭西从全国各地引⼊35家国内优秀的数据标注企业,通过导⼊百度⾃有的数据标注业务,为⼈员提供业务培训,帮助标注企业实现营业收⼊近亿元。百度⼆期办公场所投⼊使⽤以来,办公规模扩⼤了3倍,从业⼈员达到2000余⼈,成为全国范围内⼈员和产值规模最⼤的单体数据标注基地。
⼭西省政府为了⽀持数据标注产业的发展,陆续颁布了《⼭西省数据标注产业发展规划(2019-2025
年)》《⼭西省加快数据标注产业发展的实施意见》和《⼭西⼈⼯智能基础数据产业专项资⾦管理办法》,为⼊驻⼭西转型综改⽰范区的标注企业提供了⼀系列的扶持配套政策。
2019年12⽉2⽇,⼭西省委书记楼阳⽣在参观⼭西(百度)数字标注产业基地时指出,建设数字⼭西,是推进治理体系和治理能⼒现代化的必然选择、必由之路,他希望百度加强与⼭西的合作,拓宽应⽤服务领域,为建设数字⼭西、打造数字政府作贡献。
2020年6⽉6⽇,百度智能云数据众包与⼭西省政府达成合作协议。双⽅将进⼀步深化合作,加快推进⼭西省重⼤转型项⽬建设,共同打造⼭西综改⽰范区AI数据交易平台。
AI数据交易平台的建⽴,将不断扩展百度在⼭西的业务,帮助⼭西省数据服务类企业扩⼤经营范围,促进数据资源的开放与共享;同时,百度正在牵头制定数据标注的地⽅标准,将进⼀步标准化省内各项数据服务业务,提⾼⼭西在全国范围内的影响⼒,推动⼭西数字经济转型。
百度智能云数据众包⾼速增长
盛德提银机百度智能云数据众包⾼速增长
据艾瑞咨询《2019年中国⼈⼯智能基础数据服务⾏业研究报告》显⽰,凭借着较早的布局和投⼊,百度智能云数据众包实现了市场占有率和营收规模业界第⼀,2019年业务年度增长率超50%。⾃2011年起,百度智能云数据众包就全⾯⽀持百度⾃动驾驶、⼩度助⼿等AI业务。经过⼗年沉淀和打磨百度智能云已经建⽴起采标能⼒业界第⼀、流程标准化⼯具智能化、全流程管控确保数据安全的⼀站式AI数据服务平台,全⾯涵盖了包括智能驾驶、⼿机⾏业、互联⽹和AI开发者四⼤领域的全部头部客户,成为国内最⼤的AI数据服务提供者。
鞋楦机例如,采标能⼒⽅⾯,百度智能云数据众包建⽴起了业界第⼀的海量⼈⼯智能基础数据采标能⼒。通过⾃建⼭西标注基地,拥有超过2000名专业全职标注⼈员;构建了遍布全国乃⾄全球22个国家渠道代理资源池,拥有超过5万名线下采集员;超过2000万名的众包互联⽹⽤户,随时响应各类数据采标需求,满⾜市场95%标注场景需求。
新基建给⼈⼯智能产业相关领域的发展带来了前所未有的机遇,提前布局且有着完善⽣态建设的百度智能云不仅带动了AI数据服务⾏业的⾼质量发展,更积极履⾏了企业的社会责任,为各⾏各业智能化转型提供动能,加速智能经济到来。

本文发布于:2024-09-22 19:29:10,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/1/144837.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:数据   标注   百度
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议