新闻中心
-
03-22Umi-OCR— 免费 OCR 文字识别工具,支持截图、批量图片排版解析Umi-OCR是什么Umi-OCR是免费开源的离线OCR文字识别软件。无需联网,解压即用,支持截图、批量图片、PDF扫描件的文字识别,能识别数学公式、二维码,可...
-
03-22Step-Video-TI2V— 阶跃星辰开源的图生视频模型Step-Video-TI2V是什么Step-Video-TI2V是阶跃星辰(StepFun)推出的开源图生视频(Image-to-Video)生成模型,拥有3...
-
03-22InternVL— OpenGVLab 推出的多模态大模型InternVL是什么InternVL是上海人工智能实验室OpenGVLab推出的多模态大模型,专注于视觉与语言任务。采用ViT-MLP-LLM架构,通过视觉模...
-
03-22Orpheus TTS— 开源AI语音合成系统,支持多种语音风格OrpheusTTS是什么OrpheusTTS是基于Llama-3b架构的开源文本到语音(TTS)系统。OrpheusTTS支持生成自然、富有情感且接近人类水平...
-
03-21MIDI— AI 3D场景生成技术,能将单张图像转化为360度3D场景MIDI:单图像到3D场景生成的革命性技术MIDI(Multi-InstanceDiffusionforSingleImageto3DSceneGenerati...
-
03-21UniAct— 清华、商汤、北大、上海AI Lab共同推出的具身基础模型框架UniAct:一种新型具身基础模型框架UniAct是一种创新的具身基础模型框架,旨在解决机器人行为的异构性问题。它通过学习通用行为,提取不同机器人共享的原子行为...

