微软新AI项目为文档和电子邮件的图像添加字幕-电子发烧友网

微软的一项新AI项目旨在自动为文档和电子邮件中的图像添加字幕，以便视觉障碍软件读取图像。

微软的研究人员在有关预印本存储库arXiv的论文中解释了他们的机器学习模型的原理。

该模型使用可视语音词汇预训练（VIVO），它利用大量成对的图像标签数据来学习视觉词汇。然后，使用带有适当字幕的图像的第二个数据以帮助教AI如何最好地描述图片。

“理想情况下，每个人都应在文档，网络，社交媒体中为所有图像添加替代文本，因为这可以使盲人访问内容并参与对话。但是，可惜，人们却没有。”微软AI平台小组的软件工程经理Saqib Shaikh说。

总体而言，研究人员希望AI能够提供Microsoft现有字幕系统两倍的性能。

为了对新AI的性能进行基准测试，研究人员将其纳入了“无上限”挑战。在撰写本文时，Microsoft的AI现在在其排行榜上排名第一。

“无上限的挑战实际上是如何描述您在训练数据中没有看到的那些新颖的物体？”微软研究实验室的首席研究经理王丽娟评论道。

希望使用Microsoft自动字幕AI来构建应用程序的开发人员已经可以这样做，因为Azure Cognitive Services的Computer Vision软件包中提供了该功能。

微软令人印象深刻的SeeingAI应用程序将使用新的AI进行更新，该应用程序使用计算机视觉描述视力障碍者的周围环境。

“图像字幕是可以实现广泛服务的核心计算机视觉功能之一，”Azure AI认知服务的CTO黄表示。

黄继续说：“我们AI的这一突破以Azure为平台，以服务于更多客户。” “这不仅是研究上的突破；在Azure上将突破转化为生产所需的时间也是突破。”

改进的自动字幕功能也有望在今年晚些时候在Outlook，Word和PowerPoint中使用。
责任编辑：YYX

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

微软

微软

+关注

关注
4

文章
6594

浏览量
104054
AI

AI

+关注

关注
87

文章
30851

浏览量
269017

万里红电子邮件内容保密检查系统的优势

电子邮件，作为一种更正式、专业的沟通渠道，是党政机关单位处理业务工作中必不可少的通信方式之一。电子邮件传输迅速、使用便捷、长期保存，很多机关单位建设了专有的电子邮件系统，进行公文传递、修改和审批

发表于 12-13 10:11 •138次阅读

微软新型专利实现电子邮件与聊天工具的无缝切换

　5 月 30 日消息，美国商标和专利局近日于 5 月 21 日公布授予微软一项专利，该专利涉及一种全新的系统可实现从电子邮件至聊天工具的无缝切换。

发表于 05-30 15:31 •436次阅读

微软AI新成果：将不可编辑PDF转化为可编辑文档

市面现有相关软件虽能将PDF转为可编辑版，但易丧失原始布局。微软研究论文名为《从不可编辑文档生成可编辑文档的方法和系统》，其独特之处在于运用AI威廉希尔官方网站保持了字体、色彩、布局及

发表于 05-30 10:11 •690次阅读

微软Office Outlook Lite服务升级，支持短信功能

据报道，微软于今日宣布更新 Outlook Lite 服务，使其支持 SMS 短信功能。微软称，通过此项升级，用户现可整合管理电子邮件及 SMS 短信，有效提升沟通效率。

发表于 05-28 11:41 •586次阅读

微软网页版PPT新增语音识别及字幕生成功能

据报道，微软计划于今年六月份推出网页版PowerPoint全新语音识别功能。此项功能将能够监控PowerPoint视频中的声音，进而自动生成字幕。

发表于 05-16 14:36 •418次阅读

微软中国AI团队或将整体搬迁至美国或澳大利亚

5月15日，钛媒体爆料称，微软公司已经通过电子邮件形式，通知旗下中国区域负责人旗下AI研发团队，包括C+AI团队以及Azure ML团队等，将全员迁移至美国或者澳大利亚。据悉，此次搬迁

发表于 05-15 16:29 •923次阅读

谷歌Gmail将支持Gemini总结电子邮件内容

谷歌透露，Gemini 将协助 Workspace 和 Google One AI Premium 的用户理解和处理电子邮件内容。用户可通过移动应用和网页版 Gmail 使用 Gemini

发表于 05-15 11:11 •789次阅读

微软新版Outlook邮件应用提高垃圾邮件防御能力

微软称，垃圾邮件即指收件箱中无意接收的、未经许可的邮件信息，包括那些意图推广产品或服务的商家以及名为网络钓鱼的虚假邮件，这些邮件往往假扮成官

发表于 05-14 09:50 •374次阅读

2024年第一季度电子邮件威胁报告：美国垃圾邮件数量居首，制造业受害较多

具体而言，在各类被攻击对象之中，制造业、政府部门以及IT行业成为了黑客的主要目标。该报告显示，在2024年第一季度，制造业收到了43％的电子邮件，政府部门15％，IT行业11％的攻击。

发表于 05-14 09:31 •708次阅读

微软Windows 11 AI探索者功能揭秘

早前于 4 月 27 日，Xeno 曾详细解释过 Windows 11 AI Explorer 的主要功能，其中一大亮点在于能够追踪用户在电脑上的全部操作活动，涵盖了各类应用程序、电子邮件、文档、会议以及观看电影等。

发表于 05-07 10:22 •433次阅读

微软发布金融聊天机器人，定价尚无确切消息

在此之前，微软已推出两款相对应的产品——适用于Office应用及Outlook邮箱的Office 365 Copilot，以及专为销售人员设计的Copilot for Sales，用以协助撰写电子邮件和收集客户信息等。

发表于 03-01 09:08 •511次阅读

微软为新闻编辑行业推出AI工具

近日，微软宣布与全球多家知名新闻机构展开紧密合作，共同探索并推动生成式AI在新闻编辑室中的创新应用。微软表示，将全力支持新闻机构优化AI威廉希尔官方网站在新闻采编和日常业务实践中的运用，并致力于培

发表于 02-18 11:08 •705次阅读

smtp服务器指啥 smtp服务器用于接收邮件吗

SMTP（Simple Mail Transfer Protocol）是一种用于在网络中发送电子邮件的协议。它定义了邮件的传输规则和相关的命令。SMTP服务器是负责接收、处理和传递邮件的服务器

发表于 02-02 10:56 •1346次阅读

微软将在电脑键盘上新增AI键

近日，微软宣布了一项前所未有的举措：为Windows 11电脑添加一个新的AI助手Copilot键。这是近30年来，微软首次在电脑键盘上做出

发表于 01-16 18:16 •1246次阅读

微软推出Copilot安卓应用类似ChatGPT功能

微软在安卓系统上的Copilot应用程序与ChatGPT非常相似，可以访问聊天机器人功能，通过DALL-E 3生成图像，并可以为电子邮件和文档起草文本。它还包括免费访问OpenAI最新

发表于 12-28 16:59 •1099次阅读

搜索历史

微软新AI项目为文档和电子邮件的图像添加字幕

评论