上午9时,重庆市渝北区菲利信科技有限公司的办公室内,25岁的蔡川军开始了一天的工作。电脑屏幕上,一款语言类人工智能大模型正在总结小说《红楼梦》第四回的内容。蔡川军发现,总结中缺少了几个重要剧情,便只给了这条结果3分,并在备注栏中将其缺漏一一列出。
蔡川军毕业于重庆邮电大学计算机专业,目前是一名人工智能大模型训练师。他的日常工作就是通过标注数据、评判结果,让大模型生成的内容越来越精准。
一个成熟的人工智能大模型,算法、算力、数据3方面缺一不可。其中,大量高质量的数据有助于不断提高大模型的准确率,这离不开训练师的努力。他们通过清洗、整合、标注等操作,生成满足机器学习训练要求的可读数据编码。
蔡川军这一上午的工作内容,是训练人工智能全文摘要功能,对大模型的摘要结果进行打分和评价。大模型在收到训练师的反馈后,会以此调整算法参数权重,不断优化生成结果。对普通用户而言,随着大模型不断优化,他们会发现人工智能越来越“懂”人类。
午休过后,蔡川军开始进行机器视觉大模型的标注工作。具体来说,他需要以自己的审美,对资料库中的服饰图片评分,并对其风格进行判断。
“这也是数据标注的一种,我如何标注图片,人工智能就如何认识这些数据。”蔡川军一边点击鼠标一边说。当人们使用人工智能生成图片时,大模型能否理解“穿着西装的男人”“穿衣风格帅气的女生”等指令,给出令人满意的反馈,就看训练师的标注质量。
“训练师的工作分为标注和质检两类,标注质量较高且稳定的训练师,就能负责质检任务。”菲利信科技员工赵杨说。2019年进入公司的赵杨,刚开始也是一名训练师,经过多个项目的历练,经验丰富的他成长为培训师,负责新员工的培训、标注标准制定等工作。
去年蔡川军初入公司时,接受了为期两周的培训,赵杨就为他授过课。“课程主要包括系统操作、数据分类、标注规则等,帮助新入职员工快速上手。”赵杨说,“做人工智能大模型训练师,我们更看重一个人的专业知识储备。”
没有经过训练的大模型就像一张白纸,需要不断投喂优质数据才能成长,这便对训练师的专业知识储备提出了更高要求。“例如,与医疗相关的大模型,我们会让有医学背景的员工来训练数据。”赵杨说。
除了专业知识,这项工作有时对训练师的性格也有要求。“训练师的审美、性格、思考方式等,都会对人工智能产生影响。例如一款大模型的定位是用户的‘伙伴’,我们就会通过性格测试,优先让具有温柔、开朗等性格特征的员工参与。”赵杨介绍。
在菲利信科技,像蔡川军、赵杨这样的训练师有1500多名,他们通过标注数据、评判结果,让大模型生成的内容越来越精准,助力人工智能行业发展。
近年来,渝北区人力资源和社会保障局持续强化数字人才培育,突出服务产业、就业与人才3个导向,促进产业链、培训链与就业链衔接。近3年,全区累计从业人员达3万人,覆盖人工智能、大数据、机器人等前沿领域。(来源:人民日报)
xiemian | 25分钟前 |
我們國家還有很多像錢學森一樣的科學家,他們默默無聞的奉獻在個個崗位,向他們致敬。 |
cixing | 81分钟前 |
好玩是好玩,就是有點卡,如果能修復這個bug,那就非常好啦 |
linbing | 42分钟前 |
唉嘿160抽兩橙,這概率屬實太低了 |
xiaotui | 23分钟前 |
肥肥的大恐龍。充了30塊錢。還能玩兒。 |
nayang | 68分钟前 |
hahahaha😌😉😈😈😈😈 |
shizheng | 44分钟前 |
男主演技在線,不錯的。雖然不認識,但是眼神很演技能駕馭這個角色 |
zikong | 21分钟前 |
這個電影非常好,陣容強大到可怕,有劉德華,周星馳,洪金寶,葉問等陣容,經典,堪比好萊塢大片,非常好,看著過癮,期待下一部 |
piaohui | 78分钟前 |
優化真的拉,前段時間外掛橫行,舉報還不成功,一噴子一個,還有那客服也真的敷衍,無語了卸了 |
jingcheng | 61分钟前 |
成功一次解鎖he結局,是一個很溫馨的遊戲呢,雖然偶爾會被嚇一跳,很喜歡幽靈事務所 |
qiehuan | 16分钟前 |
我看彈幕真的受不了了 師傅是中國小熊貓不是浣熊 這兩個不是同一個品種的 小熊貓是中國品種 浣熊是國外的品種 懂了嗎 不懂就不要在彈幕亂科普了 自己國家的小熊貓都不了解 建議去百度 我真受不了 |