登录爱丽
记住登录状态
快速登录
还没有帐号?赶快免费注册!

爱丽时尚网移动客户端SNS公众号桌面版移动端问答星探头条新闻

登录
注册
爱丽网>数码> 品牌资讯

你上传的Instagram照片,正免费帮Facebook训练AI模型?

时间:2018-05-07      来源:T客邦      作者:数位时代
分享到:

    要训练机器学习辨识图片中的物件,往往需要耗费人力、时间标注出名称、类别,才能让机器顺利训练,为打造出方便厉害的 AI 机器学习模型,Facebook 有一项超级秘密武器── 35亿张的 Instagram 公开照片,以及无数的 Hashtag。

 

    Instagram公开照片,成免费训练模型素材

 

    如果你习惯在发文时替照片加上几个 Hashtag,那么你有可能正在帮 Facebook 训练机器学习模型。

 

    过去要训练机器学习辨识物件,必须耗费相当多的人力,举例来说,如果希望计算机能理解「马克杯」这个东西,人类必须先标记出这个东西是「马克杯」,接着机器才能够有依据学习,现在Facebook找到了一个用少量人力就能训练机器学习的方法。

 

    在第二天的开发者大会 F8上,首席技术长迈克·施罗普佛(Mike Schroepfer)表示,Facebook 研究人员与工程师,利用平台上35亿张公开照片、超过17,000个 Hashtag 为基础,透过上百个 GPU 解析资料,来训练自家的图片辨识模型,目前在 ImageNet(图像数据库)上已经可以达到85.4%的准确度。

 

    但过程中也面对不少挑战,迈克·施罗普佛(Mike Schroepfer)谈到,许多用户常常用错标签,象是用户虽然在照片上标记「花枝」,但其实是「鱿鱼」。另外,Facebook 也必须训练那些 Hashtag 是同义词,并将具体描述的Hashtag,排序优于其他同类型 Hashtag,最终变成一套「大规模Hashtag预测模块」,来训练图像辨识模块。

 

你上传的Instagram照片,正免费帮Facebook训练AI模型?

 

    ▲Facebook 利用 Instagram 上35亿张公开照片,加上用户标注的 Hashtag,来训练机器学习模型。

 

    图片来源: Facebook

 

    Hashtag训练模型,会有隐私问题吗?

 

    不过现阶段大家更关心的还是「隐私」问题,当用户发布一张 Instagram 照片时,可以清楚知道自己正在提供资料,训练深度学习模型吗?

 

    Facebook 表示,图像资料只会用来辨别与 Hashtag 之间的关联性,使用的资料都是公开的,且就算照片本身没有标签,就算机器再怎么厉害,也无法辨识出照片中的物件。简单来说,在 Instagram 上传公开照片,不论用户是否愿意,都正在为 Facebook 的深度学习技术做出贡献。

 

你上传的Instagram照片,正免费帮Facebook训练AI模型?

 

    ▲首席技术长迈克·施罗普佛(Mike Schroepfer)表示,过程中也面临不少挑战,象是许多用户常常用错标签。

 

    图片来源: Facebook

 

    但 Hashtag 仍是训练的关键,如果用户不想要自己的照片变成训练机器学习的素材,就不要在公开的贴文中加上 Hashtag。  Facebook 强调,团队只会在公开的 Hashtag 中,撷取与图像有关的素材,不会从照片内容推断用户行为。

 

    Facebook 建构训练机器模型的方法,比起辨识精准度本身更有趣,将庞大、杂乱的素材整理成整齐、有依据的资料,未来可以帮助用户更精准、快速的搜寻资料,甚至用 AI 自动生成图片说明、协助审核平台内容。

 

    文章来源:T客邦 如转载请标明出处

 

    更多精彩请点击:https://www.techbang.com/

上一篇 1 下一篇

热点阅读

热门频道

精彩推荐

热点排行

热门标签