训练_第2页_陕西然坤悦科技有限公司

400-5689-0921
客服咨询
- 在线咨询

新闻中心 NEWS CENTER

您当前位置：首页

05-27

全面超越DPO：陈丹琦团队提出简单偏好优化SimPO，还炼出最强8B开源模型

为了将大型语言模型（LLM）与人类的价值和意图对齐，学习人类反馈至关重要，这能确保它们是有用的、诚实的和无害的。在对齐LLM方面，一种有效的方法是根据人类反馈的...
05-25

通用世界模型问世：不学习就能生成新领域视频，可实时控制

随着OpenAI今年2月发布Sora，世界模型（WorldModel）再次成为了AI领域的热门。世界模型，即通过预测未来的范式对数字世界和物理世界进行理解，一直...
05-24

世界模型也扩散！训练出的智能体竟然不错

世界模型提供了一种以安全且样本高效的方式训练强化学习智能体的方法。近期，世界模型主要对离散潜在变量序列进行操作来模拟环境动态。然而，这种压缩为紧凑离散表征的方法...
05-24

数据更多更好还是质量更高更好？这项研究能帮你做出选择

对基础模型进行scaling是指使用更多数据、计算和参数进行预训练，简单来说就是「规模扩展」。虽然直接扩展模型规模看起来简单粗暴，但也确实为机器学习社区带来了不...
05-24

Ilya离职后第一个动作：点赞了这篇论文，网友抢着传看

自IlyaSutskever官宣离职OpenAI后，他的下一步动作成了大家关注焦点。甚至有人密切关注着他的一举一动。这不，Ilya前脚刚刚点赞❤️了一篇新论文—...
05-24

首个GPU高级语言，大规模并行就像写Python，已获8500 Star

经过近10年的不懈努力，对计算机科学核心的深入研究，人们终于实现了一个梦想：在GPU上运行高级语言。上周末，一种名为Bend的编程语言在开源社区引发了热烈的讨论...

: 电话

: 客服

: 地图

: 搜索