Open UI 是一个开放源代码的项目,致力于创建一个可扩展、可定制,并且能够跨平台运行的用户界面框架。该项目的目标是提供一套标准化的组件库,让开发者可以更高效地构建响应式的Web应用,同时保持对最新Web技术的兼容性和前瞻性。
Open UI 基于现代Web技术如HTML、CSS和JavaScript(尤其是配合React或Vue等前端框架)。它采用了模块化的设计,允许开发者按需引入所需组件,大大减少了代码体积。此外,Open UI 还利用Web Components技术,实现了组件的封装和复用,使得UI开发更加简洁和高效。
https://github.com/wandb/openui
SWE-agent是开源版AI程序员,可修复GitHub中的问题,具有SOTA性能。它需要Docker和Miniconda等条件,包含两个步骤:接收问题并返回拉取请求,评估拉取请求以验证问题是否解决。它来自普林斯顿大学 NLP 组
https://github.com/princeton-nlp/SWE-agent
DepthFM:一个多功能且快速的最先进的生成式单目深度估计模型。除了传统的深度估计任务外,DepthFM还展示了在深度修复等下游任务中的最先进能力。
https://github.com/CompVis/depth-fm
mPLUG-DocOwl
阿里mPLUG团队发布最新开源工作mPLUG-DocOwl 1.5 多模态大型语言模型,针对高分辨率图片文字识别、通用文档结构理解、指令遵循、外部知识引入四大挑战,提出了一系列解决方案。
https://github.com/X-PLUG/mPLUG-DocOwl
MVEdit
快速生成高质量的3D物体
https://github.com/Lakonik/MVEdit
https://huggingface.co/spaces/Lakonik/MVEdit
RMBG v1.4
AI抠图模型
https://huggingface.co/briaai/RMBG-1.4
Prompt-singer
歌曲生成模型
https://prompt-singer.github.io/
MuseV
虚拟人视频生成新工具
https://github.com/TMElyralab/MuseV
https://huggingface.co/spaces/AnchorFake/MuseVDemo
Stirling-PDF
PDF文件操作的开源工具
GRM
图片生成3D模型或场景