新闻中心
-
11-21神级项目训练GPT-2仅需5分钟,Andrej Karpathy都点赞租用H100的钱只需233美元。还记得AndrejKarpathy纯C语言复现GPT-2大模型的项目吗?今年4月,AI领域大牛Karpathy一个仅用1000行...
-
11-20阿里云百炼上线百万长文本模型Qwen2.5 -Turbo,百万tokens仅需0.3元11月20日消息,阿里云推出最新升级的Qwen2.5-Turbo模型,现已上线百炼平台。这款模型拥有100万超长上下文处理能力,相当于100万个英文单词或150...
-
09-11节省数年时间,AI发现更高效绿氢催化剂仅需几天,36,000多种混合金属氧化物训练编辑|KX氢能被誉为「21世纪的终极能源」,因具有重量轻、发热值高、清洁低碳、可回收利用等多重特性而备受青睐。质子交换膜电解水具有能量转换率高、产物氢气纯度高等...
-
06-24字节豆包全新图像Tokenizer:生成图像最低只需32个token,最高提速410倍AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
04-25仅需Llama3 1/17的训练成本,Snowflake开源128x3B MoE模型Snowflake加入LLM混战。Snowflake发布高「企业智能」模型Arctic,专注于企业内部应用。刚刚,数据管理和仓库提供商Snowflake宣布加入...
-
04-15CVPR 2025 | 仅需文本或图像提示,新框架CustomNeRF精准编辑3D场景美图影像研究院(MTLab)与中国科学院信息工程研究所、北京航空航天大学、中山大学共同提出了3D场景编辑方法——CustomNeRF。该研究成果已被CVPR20...

