face-to-sticker
AI Tools“face-to-sticker”可以将任何面孔转换成贴纸。
发现最好的 AI 开发工具,涵盖 AI 编程助手、MCP 服务器、图像生成工具等。
“face-to-sticker”可以将任何面孔转换成贴纸。
Facebook广告库MCP服务器
fairseq是一个用于训练自定义翻译、摘要和语言模型等序列模型的工具包。
FantasyTalking 通过连贯的运动合成,逼真地生成说话人像,并已开源代码和模型权重。
Farfalle 是一个支持本地和云端模型的开源AI搜索引擎。
Farfalle 是一个支持本地和云端模型的开源AI搜索引擎。
Fashion-VDM是一种视频扩散模型,用于生成高质量的虚拟试穿视频,保持人物特征和动态一致性。
该项目提供一种响应速度不到500毫秒的AI语音助手,使用多种先进技术打造。
Fast GraphRAG是一个高效、可解释的框架,旨在简化智能数据检索流程。
本地隐私RAG
FasterLivePortrait利用TensorRT在RTX 3090上实现真人肖像实时生成,速度达30+ FPS。
FastMCP是一个简洁高效的Python库,用于快速构建MCP服务器,支持LLMs功能。
FastVLM是一种高效视觉语言模型,通过创新视觉编码器FastViTHD,显著减少高分辨率图像的编码时间。
利用预训练扩散模型生成无限长文本驱动的视频
Figma 是一个集设计、原型制作与跨团队协作的强大工具。
Film Scan Converter是一个独立应用,能将数字相机拍摄的RAW胶卷扫描处理成最终图像。
Finalframe是一个基于AI的视频剪辑工具。它支持将文本转化为视频,用户只需要输入文字描述,Finalframe就可以自动生成视频素材。该工具还提供了一个非常直观方便的剪辑界面,用户可以通过拖拽、添加、删除等操作,快速剪辑生成想要的视频作品。Finalframe可以大大简化视频制作流程,使用户无需学习专业编辑软件就可以轻松获得高质量的创意视频。
Find My Kids利用WhatsApp和DeepFace,检测照片中的特定人脸并通知指定联系人。
Amazon Bedrock 支持用户定制 Claude 3 Haiku 模型以提升业务效果。
通过空间控制输入和文本描述来控制图像生成的方法
FineWeb 2 是一个多语言高质量预训练数据集,支持超千种语言,为模型训练提供丰富数据。
A股AI博弈多智能体
FinGPT是一个开源的金融大模型,旨在通过轻量化适应和人类反馈强化学习,提升金融数据处理能力。
FinRobot 是一个基于大语言模型的开源金融AI代理平台,适用于多种金融应用。
AI驱动的数据丰富工具:Fire Enrich
Firecrawl MCP Server是一个集成了Firecrawl网络爬取能力的模型上下文协议(MCP)服务端实现。
AI实时引用搜索引擎
多语种长对话流式语音合成
AI驱动的深度网络研究工具
Sora是一个创新的模型,能够帮助创意人士实现新奇和超现实的想法,让不可能成为可能
Fish是一个基于AI的音乐多模态项目,可以生成和识别和弦、节拍、歌词和旋律等音乐元素。
Fish Speech 开源TTS模型支持中日韩,语音合成不止于自然
FLAIR是一种利用长视距离的机器人操作系统,用于控制多自由度机械臂进行逼真食品的进食操作。
通过提供一张或几张参考面部图像和文本提示,用户可以在保留高度身份真实性的同时,轻松个性化自己照片的实用工具
FlashMLA是一款针对Hopper GPU优化的高效MLA解码内核,支持可变长度序列处理。
FlashRAG是一个高效研发RAG的Python工具包,包含32个基准数据集及12个先进算法。
Flow是一个轻量级任务引擎,专注于构建简单灵活的AI代理,支持并发执行和动态调度。
Flow是一个轻量级任务引擎,专注于构建简单灵活的AI代理,支持并发执行和动态调度。
Flow Matching是一个基于PyTorch的库,提供连续与离散流匹配算法的实现,适用于文本和图像。
FlowGram.AI是字节跳动开发的节点式工作流引擎,支持固定和自由布局,并赋能AI能力。
流畅阅读是一款支持多翻译引擎和模式的高效浏览器翻译插件。
FLUX 是 Black Forest Labs 的文本到图像及图像到图像转换模型。
FLUX 是 Black Forest Labs 的文本到图像及图像到图像转换模型。
用户通过点击图像的特定部分实现域区图像动画
Follow-Your-Emoji 是一个基于扩散模型的精细控制与表现力丰富的肖像动画框架。
FoloUp是一个开源平台,利用AI技术为公司提供高效的招聘面试解决方案。
Foosbar是一款完全自动化的桌上足球机器人,能与人类玩家对战,具备防守、传球和射门能力。
Fragments by E2B 是一个开源项目,支持安全执行 AI 生成的代码,兼容多种技术栈和 LLM 提供商。
使用 Viggle 和 Domo AI 成为蜘蛛侠!
“Frames of Mind”项目旨在可视化R1的思维过程,通过文本链、OpenAI API和t-SNE绘制思维嵌入图。
Cursor免费使用助手
Free-Search是一个API,利用自定义搜索引擎和爬虫技术,为AI应用提供实时的Google搜索结果,包含来源、链接和内容。
FreeChat 是一款无需联网的本地聊天应用,支持自定义角色和离线对话。
允许用户无需登录就可以免费使用 GPT-3.5-Turbo API服务
多语言PDF阅读翻译问答
通过上传图片,用户可以调整年龄、眼睛颜色、头发颜色或服装等各种细节,实现定制化和独特的效果
FreeVideoLLM是一种高效的无训练视频语言模型,采用提示引导的视觉感知方式。
Freeze-Omni是一种智能、低延迟的语音对话模型,基于冻结的文本大语言模型,支持流式语音输入输出。
FRIDA是一个协作机器人画家,可以根据语言描述或图像在画布上作画。
Fuji-Web是一款基于AI的浏览器自动化工具,可自主导航网站并执行任务。
完全本地运行的文档聊天应用,无需连接网络即可使用
阿里巴巴的语音转文字
FunAudioLLM是一个为人类和大型语言模型(LLMs)之间自然语音交互打造的语音理解和生成基础框架。
基于阿里语音库的开源、精准、适用于本地部署的视频剪辑工具。
FuzzyAI Fuzzer是一个自动化测试工具,帮助开发者和安全研究人员识别和修复LLM API中的安全漏洞。
fyin是一种开源工具,可本地运行,作为Perplexity AI的替代方案。
fyin是一种开源工具,可本地运行,作为Perplexity AI的替代方案。
GamingAgent是个人电脑游戏智能体,通过API和策略,让AI自动玩超级玛丽、2048和俄罗斯方块等游戏。
Garment3DGen是一个3D服装风格化和纹理生成工具。
智能医疗助手系统
Gecko是一种从大型语言模型中提炼出的多功能紧凑文本嵌入模型,由Google DeepMind发布。
Gem-assist是Python终端个人助理,利用LLM提供文件操作、网络搜索等工具,支持扩展和自定义。
该项目是使用Pipecat Web SDK和Gemini Multimodal Live API构建的聊天应用程序入门套件,支持多种聊天模式。
Gemini 1.5 Pro在180多个国家上线,支持原生音频理解、系统指令、JSON模式等新功能
Gemini 2.0 Flash能通过文本生成图像,并用自然语言编辑现有图像,支持对话式迭代修改。
Gemini 2.5 是 Google 最新的智能 AI 模型,具有更强的推理和代码能力,可以解决复杂问题。
Gemini Coding Agent是基于Gemini模型的Python交互式编程助手,可读写文件、执行命令,并提供安全沙箱环境。
Gemini AI Code Reviewer 是一个 GitHub Action,利用 Google 的 Gemini AI 自动审核拉取请求并提供改进建议。
使用Next.js构建的开源AI聊天机器人应用程序模板
Gemini CLI GitHub 工作流自动化
Gemini OpenAI API 适配器
Gemini CLI转API代理
Gemini CLI 跨平台界面
Gemini Code是终端AI编程助手,由Gemini 2.5 Pro驱动,支持多种LLM模型,并能自动使用工具。
Gemini Coding Agent是基于Gemini模型的Python交互式编程助手,可读写文件、执行命令,并提供安全沙箱环境。
Gemini Cursor 是一款智能桌面鼠标,能够识别屏幕、听取语音并进行对话。
AI智能体协调编排
Gemini赋能Claude Code:Anthropic兼容代理
Gemini LangGraph全栈研究助手快速启动项目
Claude Code 增强:Gemini MCP 服务器
Gemini Multimodal Playground 是一个支持语音对话的 Python 应用,使用 Google 的 Gemini 2.0 AI 模型。
免费试用Gemini Pro 1.5
Gemini-Search是一个基于Google Gemini 2.0的搜索引擎,可实时获取带引用的AI答案。
如何使用Gemini模型获取和显示边界框信息,适合开发者扩展
Gemini 对话时间轴
Gemini英语口语助手通过AI实时反馈帮助用户提高英语发音和语法纠正。
Gemini 转 OpenAI 兼容 API
Gemini CLI 本地 API 封装与 OpenAI 兼容代理
Geminipro Next Web Gemini is an AI-powered tool designed for developers and creators.
谷歌 Gemma 2B 的上下文窗口最新扩展至 10M。
Gemma Google Ai is an AI-powered tool designed for developers and creators.
Google发布Gemma 2,面向研究人员和开发者的下一代开源模型。
Gemma 2 2B是一个优先考虑安全性和透明性的高性能、轻量级AI模型。
Gemma-2-9B-Chinese-Chat是首个为中英文用户设计的指令微调语言模型,具备角色扮演等多种能力。
Gemma 3是Google基于Gemini 2.0研发的轻量级开源模型系列,可在单GPU或TPU上运行,性能强大。
由Runway推出的高保真可控视频生成模型。
GenAgent是一个构建协作AI系统的框架,支持自动生成工作流程,提升复杂任务的执行效率。
GenCast是一个基于扩散模型的中期天气预报工具,提供多个预训练模型及示例代码。
Generative Models By Stability Ai Stability Ai Ai Sdxl Turbo is an AI-powered tool designed for developers and creators.
Genesis是一个多功能物理平台,适用于机器人、具身智能和物理AI应用,提供高效的仿真和数据生成。
Genie是一个基于互联网视频训练的基础世界模型,能够通过单张图片提示生成无尽种类的可玩(可通过行动控制)世界,这些图片可以是合成图像、照片乃至素描。Genie的独特之处在于其能够只通过观看互联网视频学习精细的控制能力,而这些视频通常不包含关于正在执行的动作的标签,甚至不明确哪部分图像应该被控制。尽管如此,Genie不仅学会了哪些观察部分通常是可控的,还推断出了在生成环境中一致的多种潜在动作。
GenWebBuilder是一款创新的网站生成平台,利用生成式人工智能技术,可以将图片、草图或在线内容即刻转化为令人惊艳的互动网页应用。这个平台可以帮助用户轻松地定制每一个网页应用的细节,而且无需编码知识。它的AI驱动平台能够自动化整个网站创建过程,无需专业编码技能即可实现创意。GenWebBuilder是一个可以加速业务增长的平台,能够将图片和草图转化为吸引人的网页应用,助力企业适应市场变化并实现持续增长。通过直观的提示定制设计,GenWebBuilder简化了网页开发的流程。
AI网页内容优化审计
《深入了解Mistral》是一个面向初学者的课程,教你如何使用Mistral AI的先进开源和商业模型。
《深入了解Mistral》是一个面向初学者的课程,教你如何使用Mistral AI的先进开源和商业模型。
AI渗透测试助手:GHOSTCREW
GibberLink演示了两个对话式AI在发现彼此身份后,从英语切换到音频协议的互动过程。
用户输入提示词创建任何GIF
通用任务智能代理编排框架
基于大型语言模型(LLM)的技术,Gigax使得NPC能够执行一系列的动作,比如说话、跳跃、攻击等
AI赋能Git命令行助手
GitAgent 是一个个人化的 Git 智能助手,支持代码搜索、重构、自动注释等功能。
GitFriend是一款AI驱动的GitHub助手,旨在通过AI聊天、README生成等功能,简化代码仓库管理,提升开发效率。
AI编程伴侣
GitHub Copilot for Xcode 是一款智能代码建议工具,助力开发者提升编码效率。
以Copilot 为中心的创新开发者环境,让开发者能用自然语言从构思到编码再到软件开发。
GitHub Spark,使用自然语言构建 Web 应用程序。
Github 助理是一个通过自然语言处理技术提供详细、独特解决方案的AI助手。
GitIngest是一款能够将任意Git仓库转换为适合大型语言模型提示的文本摘要工具。
GLM-4是智谱AI推出的最新多语言、多模态预训练模型系列,性能卓越,支持多种高级功能。
GLM-4-Voice是智谱AI推出的语音模型,可进行中英文实时语音对话并调节语音特性。
GLM-4.5智能体混合推理基础模型
Globe Explorer Ai is an AI-powered tool designed for developers and creators.
10 种语言文本准确渲染,将文本渲染的准确性从提高到近 90% ,同时还能实现段落渲染+自动布局
Gmail AutoAuth MCP Server让Claude能用自然语言管理Gmail,支持邮件发送、读取、搜索和标签管理等功能,认证方便。
GoEnhance是一个AI视频转绘工具,主要的魅力在于能够把普通的视频转换成具有特定艺术风格的视频。这项技术适合在一系列不同的场景下使用,特别是那些希望给视频添加创意和艺术效果的用户。现在,让我们来深入了解GoEnhance的功能以及适用场合。
Golf是一个简化MCP服务器应用开发的框架,通过Python文件定义服务器功能,自动编译为FastMCP服务器,加速开发进程。
Google Ads MCP: 连接Google Ads和Claude AI,通过自然语言对话分析广告数据,优化广告效果。
GA 数据智能分析服务器
Google Gemini是一款AI助手应用,旨在提升用户的创造力和生产力,支持多种功能与Google服务连接。
Google 使用 AI 改进了 Sheets
Google Search Console MCP server 连接 GSC 和 Claude AI,让 SEO 通过自然语言对话分析网站数据,提升优化效率。
Google 反爬搜索与AI集成
Google Sheets MCP是一个连接器,使AI代理能直接与Google Sheets电子表格进行交互操作。
Google AI生成视频的实验性大型语言模型
Goose Googleai is an AI-powered tool designed for developers and creators.
OpenAI发布集成视觉能力的先进人工智能模型GPT-4 Turbo with Vision
GPT-4.1 Prompting Guide是OpenAI提供的指南,旨在帮助开发者充分利用GPT-4.1模型的改进能力,包括 agentic 工作流、长上下文处理和指令遵循等方面。
GPT-4o是OpenAI发布的新一代免费模型,支持文本、语音和图像的实时交互。
本地私有AI照片风格化工具
GPT-API-free是一个提供包括GPT-4在内多种OpenAI模型的API服务,免费直连国内无需代理。
gpt-frontend-code-gen 是一款通过对话生成和迭代前端页面的工具。
基于Raspberry Pi和OpenAI API搭建的智能家居助手
GPT-image-1 是 OpenAI 最新、最先进的图像生成模型。它是一个原生的多模态语言模型,于今天凌晨1点30通过 API 向全球开发者开放使用。
GPT图像编辑模型
开放权重推理与智能体模型
地址:https://github.com/mshumer/gpt-prompt-engineer
基于GPT-2模型的聊天机器人
GPT4o Captcha Bypass是使用GPT-4和Selenium解决多种验证码的CLI工具。
基于大型语言模型的提高代码质量工具
gptme 是一个功能强大的个人AI助手,支持在终端中执行代码、编辑文件及网页浏览等多种操作。
gptpdf 是一个利用VLLM解析PDF为Markdown的工具,几乎完美支持数学公式、表格等。
gptpdf 是一个利用VLLM解析PDF为Markdown的工具,几乎完美支持数学公式、表格等。
Gpts App Gpts is an AI-powered tool designed for developers and creators.
Gradio WebRTC 是一个实时视频音频流组件,支持网页应用中的声音和图像传输功能。
IBM推出的一系列编码生成模型
Granite Retrieval Agent是一款结合本地文档和网络检索的智能助手工具,旨在提升个人生产力。
多语言代码图谱RAG系统
Graph-constrained Reasoning(GCR)是一种将知识图谱结构与大型语言模型推理相结合的新框架。
GraphRAG与DeepSearch融合的智能问答Agent
GraphAgent是一个智能图语言助手,集成图生成与任务执行,优化复杂数据分析与生成任务。
GraphGen利用知识图谱生成高质量合成数据,优化大型语言模型的监督微调效果。
Graphiti是一个动态知识图谱构建工具,支持时间感知和复杂关系处理,适用于多种智能应用。
Graphiti是一个动态知识图谱构建工具,支持时间感知和复杂关系处理,适用于多种智能应用。
GraphRAG 微软开源的知识图谱RAG
GraphRAG Accelerator是一个基于Azure的API加速器,用于索引和查询知识图谱。
GraphRAG通过动态社区选择优化全球搜索,提高搜索效率与准确性。
GraphRAG本地版结合Ollama和交互式UI,支持本地模型并提供3D可视化和文件管理功能。
GraphRAG4OpenWebUI将微软的GraphRAG技术集成到Open WebUI,实现高级信息检索功能。
马斯克开源的Grok-1模型,目前为止最大的开源大语言模型
具备更强的推理能力和128,000词元的上下文长度,即将在𝕏平台提供
一款能够处理文本和视觉信息(如文档、图表和照片)的首款多模态模型
Grok 4 命令行工具
Grok多功能OpenAI兼容API
Groq 500Token is an AI-powered tool designed for developers and creators.
Groq 驱动的可定制代码 CLI
Groq Chrome扩展能够快速总结网页内容,帮助用户提升在线浏览体验。
Groqbook是一款使用Groq和Llama3在几秒内生成整本书的streamlit应用。
Groqqle 2.0是一款免费AI搜索引擎,能快速生成多语言原创内容,适用于各种市场需求。
Grounded-VideoLLM是一款用于视频理解的语言模型,专注于细粒度时序定位任务。
Groundhog AI 是一个用 Rust 构建的教学工具,旨在帮助用户理解代码助手的工作原理。
Grunty是一款自托管的桌面应用程序,可以让AI控制你的电脑,完成各种任务。
GUI-Actor:无坐标的GUI代理视觉定位
H2O AI Personal GPT是一款无需联网、完全保护隐私的智能AI助手应用。
Hacker News 中文播报是一个基于 AI 的自动新闻播客,每日提供 Hacker News 热门文章的中文总结。
企业级AI渗透测试平台
本地SQLite多格式文档RAG库
一个新闻聚合网站,可以让用户输入感兴趣的话题,立即开始与它交谈。
可以生成 4 秒的高清视频
可以生成 4 秒的高清视频