翻译官

首页 » 常识 » 问答 » 京京人家只是一个超大的数据翻译集
TUhjnbcbe - 2024/9/15 16:32:00

戴上这款神奇手环

就能隔空弹钢琴、敲键盘

近日,在版IEEEVR会议论文集中,苏黎世联邦理工学院的研究人员研发出一种名为TapID的手环,能够为VR头显提供沉浸式的手势交互。无需手握控制器,点点手指,就能获得像操作电脑、平板一样的体验。

TapID是一种可以用来检测手部动作的腕带设备,将跟踪的手部姿势与VR设备联动。用户在左右手佩戴TapID,就能够配合VR体验虚拟现实交互。比如,可以向用户显示一个像电脑键盘一样的页面,进行文本输入。可以像面前有一台电脑一样,预览网页,进入搜索引擎搜索信息。

DeepMind提出基于视觉的

强化学习模型

对于机器人学习任务来说,模仿学习是一个强大的工具。但在这类环境感知任务中,使用强化学习来指定一个回报函数却是很困难的。DeepMind最近发布了一个新模型,赋予机器人相同的能力,最终生成的模型与操作器、任务都无关,具有更好的通用性。

DeepMind最新论文主要探索了仅从第三人称视觉模仿操作轨迹的可能性,而不依赖action状态。这项研究论证了视觉模仿表征在视觉模仿中的重要性,并验证了操作无关表征在视觉模仿中的成功应用。未来工厂中的机器人将拥有更强大的学习能力,并不局限于一种特定工具,一种特定任务。

哈佛、MIT学者联手

创下矩阵乘法运算最快纪录

矩阵乘法作为一种基本的数学运算,在计算机科学领域有着非常广泛的应用,矩阵乘法的快速算法对科学计算有着极为重要的意义。年10月,来自哈佛大学与MIT的两位研究者发表了一篇论文,他们创建了有史以来矩阵相乘的最快算法,相比于之前最快算法,计算复杂度下降了10万分之一。

其中,论文一作JoshAlman是哈佛大学的博士后研究生,主要研究算法设计与复杂度理论。二作VassilevskaWilliams是MIT计算机科学与人工智能实验室(CSAIL)副教授,致力于将组合和图论工具应用于计算领域。

5亿个句子,种语言

语言技术教授发布超大翻译数据集

机器翻译(MT)属于计算机语言的范畴,其研究借由计算机程序将文字或演说从一种自然语言翻译成另一种自然语言。近日,赫尔辛基大学语言技术教授JrgTiedemann发布了一个自动翻译数据集,可用于数据增强翻译。其中包括超5亿个句子,被翻译成种语言。

这并不是Tiedemann第一次试图通过MT为各种语言创造一个「地球村」。自年以来,Masakhane项目一直在专门针对NLP中代表不足的非洲语言收集语言数据并微调语言模型。这个语言模型取得了不错的效果,但根据Tiedemann的说法,未来还有很多工作要做。

农业机器人已经大有作为

AI将会在率先在田地里崛起

人工智能在农业场景的应用更容易实现产品化(如无人机、无人车等),应用效果也更为明显。农业AI机器人将比传统的农业机器更精细化,有针对性、灵巧,做到「有眼睛、有手、有脚」,大量取代重复性工作,农业应用是AI技术最低垂的果实。

并且基于作物模型,AI可以智能地帮助人们判断农作物什么时候该施药,什么时候该施肥,以及不同的叶片表象代表植株得了什么病。随着数据的日趋完善,这些数据和模型还可以形成新的服务产业,惠及整个农业产业链,最大化发掘AI的应用潜力去赋能产业。

当GAN生成图像可以卡音效

这个python包可以实现音画同步

GAN生成的图像奇幻诡谲,对此我们早已不陌生。但是如果它们还可以卡音效呢?最近,就有人创建了一个实现类似效果的Python包——LucidSonicDreams,只需要用几行代码就可以实现音画同步。

生成艺术品通常是由GAN网络来完成的。LucidSonicDreams包默认使用StyleGAN2-ADA架构,不过GAN架构也可以自定义。将这些模型在特定「风格」的图像数据集上进行训练,使之能够输出与训练图像风格一致的无穷多张图像。

1
查看完整版本: 京京人家只是一个超大的数据翻译集