cognita
AI Tools用于组织和部署基于检索增强生成(RAG)技术的应用程序
发现最好的 AI 开发工具,涵盖 AI 编程助手、MCP 服务器、图像生成工具等。
用于组织和部署基于检索增强生成(RAG)技术的应用程序
世界上第一个完全自主的AI软件工程师Devin 已经开始接外包了
CogVideo 是清华大学研发的首个开源预训练文本生成视频模型,CogVideoX 系列进一步增强了视频生成的能力。
构建和部署基于检索增强生成技术
CoI-Agent是一款利用大型语言模型推动新创意发展的研究工具,旨在革新研究方法。
ColorFlow 是一种三阶段扩散框架,用于自动彩色化黑白图像序列,适用于工业应用。
ColorMagic是一个免费的开源调色板生成器,提供多种与色彩相关的工具,并支持AI功能。
提供比标准SDWebUI和ComfyUI更佳、更互动体验的开源AI图像和视频生成工具
comfy-groqchat是一个集成多API和大模型、支持图片反推和翻译等功能的对话节点工具。
Comfyui Instantid Comfyuiinstantid is an AI-powered tool designed for developers and creators.
Comfyui Object Migration is an AI-powered tool designed for developers and creators.
ComfyUI-B-LoRA 是一个加载并应用B-LoRA模型的定制节点,可以实现高质量的风格内容混合。
ComfyUI通过自动去抓和修复面部等功能提升旧照片的质量。
ComfyUI-Detail-Daemon是一个用于图像处理的节点,通过调整细节参数来增强图像质量。
ComfyUI-Fast-Style-Transfer 是一个用于快速风格迁移的 ComfyUI 节点。
在ComfyUI中直接使用TripoSR进行快速3D重建
ComfyUI-Fluxtapoz是一个用于图像编辑的节点集合,支持Flux和反向流不采样技术。
ComfyUI-GGUF支持GGUF格式的模型量化,优化低端GPU上的运行效率。
ComfyUI-HiDiffusion是一个为HiDiffusion技术使用而定制的节点。HiDiffusion技术是专门用于在计算机视觉和图像处理中生成和改进图片质量的先进算法。该技术通常应用于图像的超分辨率、去噪、风格转换等方面。
ComfyUI-KLingAI-API是一个自定义节点,允许直接在ComfyUI中使用KLing AI API。
ComfyUI-KwaiKolorsWrapper 是用于运行 Kwai-Kolors 文本生成图像管道的基础封装工具。
有人在ComfyUI的基础上也推出了类似 SAM 2的功能。
ComfyUI Stable Diffusion 3 API让你通过接口在ComfyUI中使用Stable 3模型。
图像和视频增强的工具,专门围绕SUPIR模型开发,通过ComfyUI界面增强用户体验
ComfyUI Unique3D 是将 Unique3D 集成到 ComfyUI 的自定义节点。
ComfyUI 提供了用于HunyuanVideo的包装节点,可以用于Vid2vid测试以及Transformer和VAE模型的使用。 HunyuanVideo的使用需要特定的文本编码器和Clip文本编码器,这些编码器需要下载到ComfyUI的相应文件夹。 由于内存使用受到分辨率和帧数的影响,即使是在24GB内存上也不能处理很高分辨率的视频,但好消息是即使在低分辨率下,模型也可以生成功能性的视频。
Comic Translate 是一个利用GPT-4翻译漫画和其他类型漫画的项目,支持多种语言。
款为企业设计的可扩展大型语言模型,专注于实现高效率与准确性的平衡。
款为企业设计的可扩展大型语言模型,专注于实现高效率与准确性的平衡。
AI多智能体协作观测平台
认知记忆RAG:长叙事推理
多智能体公司研究报告生成器
Company Researcher 是一个免费的开源工具,通过输入公司网址,快速获取全面的公司信息和洞察。
Composio是AI Agent的生产级工具集,提供超250种工具和多种框架支持,提升工具调用准确率。
这是一个无需Docker的解决方案,支持远程控制电脑,提供用户友好的Gradio界面。
Computer Using Agent Sample App是一个利用OpenAI API构建计算机使用代理的示例应用,可操控不同环境的计算机。
计算机视觉在体育中被用来检测和分析运动员和场地的关键点与图像。
Consistent Character 能生成同一角色的多个不同姿势图像。
内部竞赛AI交易系统
Continue是领先的开源AI代码助手,支持在VS Code和JetBrains中构建自定义自动补全和聊天体验。
Mahilo是AI Agent的控制平台,可创建或注册多Agent,实现团队协作、信息共享和人工监督。
ControlFlow 是一个用于构建AI工作流的Python框架,结合任务、代理和流程管理。
ControlNet++ 是一个支持多种图像生成与编辑控制的全能模型。
在线多格式文件转换器
在线多格式文件转换器
Cool Cline 是一款智能编码助手,集成多种功能,助力复杂软件开发任务,提升开发效率。
Cooragent是AI Agent协作社区,通过创建和组合智能体,以完成复杂任务,并支持分享智能体。
先进的机器人操作框架
Copilot+ PCs 是微软推出的智能Windows电脑,拥有强大AI性能和全天电池续航。
生成式AI文本到视频工具,可以将长篇内容(博客、通讯)转换成短视频
一个在苹果平台设备上高效运行Stable Diffusion模型的解决方案
NVIDIA Cosmos是一个面向开发者的平台,旨在加速物理AI系统的构建,提供预训练模型和训练脚本。
生成自动化测试的工具,使用生成式AI提升代码覆盖率
将图像生成和编辑能力结合的先进技术,通过提高图像处理的灵活性和精细度
Coze Coze is an AI-powered tool designed for developers and creators.
AI 智能体全生命周期管理平台
一站式可视化AI智能体开发平台
网页转Markdown:cpdown浏览器扩展
CrackCode是一款隐蔽的AI面试助手,可在后台无痕辅助编程解题,提供实时代码建议。
Craftgen.ai是一个开源AI平台,提供直观工作流、代理功能和实时监控,支持快速原型到生产。
Crawl4AI是一个开源的网络爬虫工具,专为AI和大语言模型(LLMs)设计,支持快速高效的数据提取与处理。
Crawl4AI RAG MCP Server是一个为AI智能体提供网页抓取和RAG能力,基于MCP协议的强大实现。
Crawl4LLM是一个高效的网页爬虫工具,旨在为大型语言模型预训练提供数据支持。
智能股票分析与投资决策
Cs50Ai Cs50Ai Chatgpt is an AI-powered tool designed for developers and creators.
Cua是一个开源框架,结合高性能虚拟化和AI agent,为AI系统提供安全隔离的交互环境。
Cursor Auto Register是一个用于自动化Cursor Pro注册的开源项目,基于Python,提供API和UI界面进行账号管理。
Cursor Chat Browser 是一款网页版应用,用于浏览和管理 Cursor 编辑器的 AI 聊天记录,支持搜索和导出。
Cursor Talk to Figma MCP 是一个项目,旨在实现 Cursor AI (一个代码编辑器) 与 Figma (一个设计工具) 之间的集成,利用 Model Context Protocol (MCP) 实现双向通信。
允许你创建和定制自己的 AI 角色
基于 OpenAI Agents SDK 的客户服务代理演示
CyberScraper 2077是一款未来感十足的AI驱动网络爬虫工具,能高效提取网页数据。
高效、灵活、可定制化的虚拟数字人制作平台
多模型AI Agent CLI
帮助创作者将想法转化为漫画内容
为语音数据集标记标签的实用程序脚本集合
科学研究AI小助手
macOS 屏幕AI时间线
数据库智能交互与分析
为每家企业提供数据智能,让组织能够理解和利用其独特数据来构建自己的人工智能系统
为黑白老照片或动画游戏风景等图像提供生动且自然的颜色
AI驱动的智能研究助手DecipherIt
深度LLM智能体框架
深度智能体用户界面
深度图代码MCP服务器
Deep Recall是一个开源LLM的记忆框架,提供企业级存储、检索和整合用户交互记录,以实现个性化响应。
Deep Research是基于Google Gemini的快速深度研究工具,能生成深度报告,注重用户隐私,数据本地存储。
Deep Research Agent 是一个文档驱动的智能研究系统,通过上下文管理和工具集成进行全面分析。
Deep Research Assistant PY 是一款基于AI的Python研究工具,助您深入探索话题并生成报告。
Deep Search Lighting是一个轻量级、纯Web搜索方案,支持多引擎聚合搜索和结果评估,适用于各类LLM模型。
AI驱动股票研究助手
基于人工智能的数据分析平台
本地文档智能研究报告
DeepEP是一个专为混合专家和专家并行设计的通信库,提供高吞吐量、低延迟的GPU内核。
DeepGEMM是一个高效的FP8矩阵乘法库,针对Hopper架构,性能优异,代码简洁易懂。
提供闪电般快速文本到语音服务的API
一个为深度学习和大模型面试准备而设计的综合项目,它覆盖了一系列与深度学习、大模型、计算机视觉、自动驾驶、智慧医疗等相关的面试题和知识点。这个项目旨在为求职者提供一个全面的准备资料库,帮助他们在面试中表现出色。
DeeplxFile是一个基于Deeplx的免费文件翻译工具,支持Word、Excel等格式,大文件无限制。
AI智能深度搜索与研究
深度研究智能体大模型
深度研究代理综合评测基准(DeepResearch Bench)
DeepResearcher是一个基于强化学习的LLM研究框架,通过真实网络环境训练,涌现认知能力,性能显著提升。
防遗忘智能角色扮演系统
DeepScaleR是一个开源项目,旨在通过强化学习技术使大型语言模型的训练和应用更普及。
AI智能体专业文章生成
DeepSearcher结合强大的大型语言模型和向量数据库,可基于私有数据实现高效搜索与智能问答。
开源的多专家代码语言模型,支持338种编程语言。
DeepSeek工程师是一款强大的编码助手应用,集成DeepSeek API进行用户对话处理和文件操作。
DeepSeek将逐日开源五个项目,共享透明进展与创新。
DeepSeek-R1是一款基于大规模强化学习的推理模型,在数学、代码和推理任务上表现优异。
DeepSeek RAG Chatbot 3.0 是一个免费、私密的本地聊天机器人,支持文档检索和聊天记忆集成。
先进的混合专家(Mixture-of-Experts,简称MoE)语言模型
DeepSeek-V3是一款强大的混合专家语言模型,具备671亿参数,表现优于大多数开源和闭源模型。
DeepSeek-VL2是一款先进的多模态视觉-语言模型,支持视觉问答和光学字符识别等任务。
DeepSeek模型兼容性检测用于评估不同模型之间的兼容性和适应性。
DeepSeek4Free是一个Python库,方便与DeepSeek AI聊天API交互,支持流式响应和网页搜索功能。
deepseek.cpp 是一个基于 C++ 的 CPU-only 推理实现,旨在为 DeepSeek 大语言模型提供支持,专注于简洁性和低硬件需求。
RAG知识路由信息筛选
DeepWiki是一款AI驱动的工具,能为GitHub等代码仓库自动创建精美、交互式Wiki文档,并生成可视化图表。
DeepWiki是一款AI驱动的工具,能为GitHub等代码仓库自动创建精美、交互式Wiki文档,并生成可视化图表。
Deepwiki MCP Server是一个非官方工具,它通过MCP抓取Deepwiki页面,转换为Markdown格式并返回文档。
DeerFlow是社区驱动的深度研究框架,结合语言模型与专业工具,致力于回馈开源社区。(源于开源,回馈开源)
Denser Chat 是一个可以从 PDF 和网页中提取信息并回答问题的聊天机器人。
Describe Anything模型(DAM)能根据图像/视频区域生成详细描述,并提供DLC-Bench评估基准。
将视觉设计直接转换为前段代码自动化前端工程流程
Desk-Emoji是一款开源AI桌面机器人,带表情屏、双轴控制和语音对话功能。
Desktop Commander MCP:通过Claude执行终端命令,管理进程,并提供文件读写、搜索、编辑等功能。
devb.io 是一个利用 GitHub 和 AI 自动生成专业开发者个人简历的平台,操作简便。
先进的AI软件工程师,能理解高级人类指令并编写代码完成目标
更高效地编程和管理代码库
DevSeeker:AI代码生成与改进工具
多代理并行开发CLI
DeWatermark是一个用于从图片中去除水印的工具,可以通过智能算法识别并删除图片上的标志、文字或任何被认为是水印的内容,而尽量保持图片本身的完整性和清晰度。这种功能尤其对于那些需要清洁图像用于合法个人或商业用途,但图像上的水印又阻碍了使用的人来说非常有用。
Dia是Nari Labs开发的16亿参数文本转语音模型,能直接生成逼真对话,并支持情感控制。
Dia是Nari Labs开发的16亿参数文本转语音模型,能直接生成逼真对话,并支持情感控制。
Dia是Nari Labs开发的16亿参数文本转语音模型,能直接生成逼真对话,并支持情感控制。
DIAMOND是一种在漫反射世界模型中训练的强化学习代理,用于提升Atari游戏的视觉细节。
AI代理Git差分记忆
前沿的多目标追踪(Multiple Object Tracking,简称MOT)方法
DiffSynth Studio是一款强大的扩散引擎,提供高效视频和图像生成功能。
Diffusion Android is an AI-powered tool designed for developers and creators.
AI图像管理工具
DiffusionDrive是一种新型截断扩散模型,实现端到端的自主驾驶,具有更快、更准确和多样化的性能。
Diffutoon是一种适合高分辨率快速运动视频渲染的卡通着色技术。
一个用于开发LLM(大型语言模型)应用的平台
Linly-Talker是一个集成多种AI技术、支持图像和语音的智能交互对话系统。
DINO-X是一款领先的统一视觉模型,能够高效实现开放世界中的物体检测与理解。
Dippy致力于开发开源高端语音模型,为用户提供沉浸式人机对话体验。
Director是一个视频代理框架,能够自动处理复杂的视频任务,如搜索、编辑和生成等。
AI智能收件箱
Django MCP Server: 连接 AI 智能体与 Django 应用
Doc2Podcast 是一个 AI 工具,能将 PDF 文档转化为引人入胜的播客音频内容。
DocAgent是一个利用多智能体和分层处理,为Python代码库自动生成高质量文档字符串的系统。
视觉AI文档RAG
Docs是一款开源协作文档编辑器,通过实时协作,让笔记转化为知识,提供易用、安全的知识构建与分享平台。
智能文档提取与格式转换
Document Buddy App是一款基于Streamlit的应用,简化PDF文档管理并提供智能聊天功能。
Documind是一款先进的文档处理工具,利用AI从PDF中提取结构化数据,支持自定义提取格式。
升级中国水墨画风格2.0
Doodle Lab是一款可以将涂鸦转化为惊人艺术品的应用程序。用户只需自由涂鸦,选择艺术风格,Doodle Lab就能在几秒钟内将您的想法变成现实。无论您是艺术家、设计师,还是只是想找一个有趣的方式来表达自己,Doodle Lab都是释放创造力的完美工具。该应用具有用户友好的界面和直观的控制,让您轻松创建美丽而引人注目的艺术作品。您可以立即下载Doodle Lab,并开始将您的涂鸦变成艺术品!
dots.llm1:142B参数MoE大模型,开源中间训练检查点
DragAnything是一种通过实体表示实现可控视频生成中对象运动控制的先进方法。
Draw2Img 是一个简单的网页界面工具,用于基于文本指导的图像生成,适合任何年龄和技能水平。
DreamClear是一项高性能的图像修复技术,专注于隐私安全的数据集管理。
DreamRunner是一款通过检索增强运动适应生成细致故事视频的工具,提升视频创作质量。
DreamWalk通过扩散指导实现风格空间的精细控制和探索。
利用大语言模型自动化将机器人仿真环境训练结果转移到真实世界
drlambda是一个采用人工智能(AI)帮助用户快速生成专业幻灯片的工具。这一工具的主要目的是简化和加速制作演示文稿的过程,使得即使是没有设计背景的人也能够创造出令人印象深刻的幻灯片。以下是drlambda功能的通俗总结以及它何时会被使用:
DroidRun是一个强大的框架,通过LLM代理用自然语言控制安卓设备,实现自动化操作。
双AI智能辩论问答
DualPipe是DeepSeek-V3提出的创新双向流水线并行算法,可实现前向后向计算通信全重叠并减少流水线气泡。
能够将 ChatGPT 接口化,让用户能够通过HTTP请求来使用ChatGPT的功能
DuckDuckGo Search MCP Server是基于DuckDuckGo的网页搜索服务器,具有内容抓取、速率限制等功能,专为LLM优化输出。
图片重复与篡改检测
LLM驱动的自然语言自动化代理框架
AI自动化代码审查
Easycontrol Ghibli is an AI-powered tool designed for developers and creators.
macOS 设计的简洁易用的词典翻译应用
单提示词图像编辑
EasyR1是一个高效、可扩展的多模态强化学习训练框架,支持各种语言和视觉模型。
EasyRec是一种基于语言模型的推荐系统,通过对用户和物品的协同信息进行处理,提升推荐效果。
ebook2audiobook是一款将电子书转换为有声书的工具,支持多语言和语音克隆功能。
EchoMimic通过可编辑的标志点条件实现逼真的音频驱动的头像动画。
EchoMimicV2是一款致力于简化的半身体人类动画生成技术,能通过音频驱动实现生动表现。
Efficient-Live-Portrait优化了实时肖像动画任务,支持ONNX和TensorRT模型。
EfficientTAM是一款高效的视频和图像分割模型,兼具性能与效率,适用于多种设备。
Eigent:多智能体AI生产力平台
ElatoAI是基于ESP32的实时AI语音方案,通过OpenAI API实现长时间全球对话。
ElevenLabs宣布进军音乐创作领域ElevenLabs Music
ElevenLabs Reader App使用高质量语音,帮助您随时随地聆听各种文本内容。
照片相似性搜索引擎
Engy是一款利用人工智能快速生成网页应用的工具,让开发者轻松实现创意,无需从零开始编码。
EscherNet是一个通过多视图条件编码实现高精度与连续相机变换的生成式模型
ETF网格交易策略设计工具
EveryoneNobel项目通过ComfyUI生成诺贝尔奖图像,致力于为每个人创造独特的视觉作品。
中科大发布的 EvTexture,用于提升视频分辨率的事件驱动纹理增强模型,提供官方Pytorch实现。
执行AI助手(EAIA)是一款人工智能助手,旨在替代传统的执行助理,处理日常事务。
EXO Private Search 是一款基于隐私保护的搜索系统,保障用户查询隐私,服务器无法查看搜索内容。
ExploreToM 是首个支持大规模生成多样且具有挑战性的Mind Reasoning理论数据的框架,用于强健训练与评估。
Extract2MD是一个强大的客户端JavaScript库,可以将PDF转换为Markdown,提供多种提取方法和可选的LLM增强功能。