AI开源项目
欢迎来到AI开源项目专区!这里收集了GitHub上热门的AI相关开源项目,按Star数量排序,帮助你了解当前最受欢迎的AI技术和工具。
项目列表
TensorFlow
- GitHub链接: https://github.com/tensorflow/tensorflow
- Star数量: 180k+
- 主要功能: 由Google开发的开源机器学习框架,支持各种机器学习和深度学习任务。
- 项目特点: 灵活的计算图结构,支持分布式训练,丰富的生态系统。
PyTorch
- GitHub链接: https://github.com/pytorch/pytorch
- Star数量: 70k+
- 主要功能: 由Facebook开发的开源机器学习框架,以动态计算图和易用性著称。
- 项目特点: 直观的API设计,强大的GPU加速,活跃的社区支持。
scikit-learn
- GitHub链接: https://github.com/scikit-learn/scikit-learn
- Star数量: 58k+
- 主要功能: Python机器学习库,提供简单高效的数据挖掘和数据分析工具。
- 项目特点: 基于NumPy、SciPy和Matplotlib,提供丰富的监督和无监督学习算法,易于使用的API。
- 教程链接: scikit-learn 入门教程
Hugging Face Transformers
- GitHub链接: https://github.com/huggingface/transformers
- Star数量: 57k+
- 主要功能: 提供预训练的NLP模型和工具。
- 项目特点: 支持多种NLP任务,提供大量预训练模型,易于使用的API,支持多种框架。
- 教程链接: Hugging Face Transformers 入门教程
Keras
- GitHub链接: https://github.com/keras-team/keras
- Star数量: 56k+
- 主要功能: 高级神经网络API,简化深度学习模型的构建。
- 项目特点: 易于使用的高级API,支持多种后端,模块化设计,适合快速原型开发。
- 教程链接: Keras 入门教程
fastai
- GitHub链接: https://github.com/fastai/fastai
- Star数量: 29k+
- 主要功能: 深度学习库,提供高层次的API。
- 项目特点: 基于PyTorch构建,提供高级抽象,包含丰富的预训练模型,注重实用主义和快速迭代。
- 教程链接: fastai 入门教程
YOLOv5
- GitHub链接: https://github.com/ultralytics/yolov5
- Star数量: 28k+
- 主要功能: 目标检测模型,以速度和准确性著称。
- 项目特点: 实时目标检测,易于训练和部署,支持多种设备和平台,提供预训练模型。
- 教程链接: YOLOv5 入门教程
spaCy
- GitHub链接: https://github.com/explosion/spaCy
- Star数量: 27k+
- 主要功能: 工业级NLP库,专注于生产环境。
- 项目特点: 快速高效的NLP处理,支持多种语言,提供预训练模型,易于集成到生产环境。
- 教程链接: spaCy 入门教程
OpenCV
- GitHub链接: https://github.com/opencv/opencv
- Star数量: 26k+
- 主要功能: 计算机视觉库,提供图像处理和计算机视觉算法。
- 项目特点: 跨平台支持,丰富的图像处理和计算机视觉算法,高性能实现,广泛应用于工业和研究。
- 教程链接: OpenCV 入门教程
GPT-J
- GitHub链接: https://github.com/kingoflolz/mesh-transformer-jax
- Star数量: 25k+
- 主要功能: 开源的GPT-J语言模型。
- 项目特点: 6B参数的语言模型,基于JAX框架,支持多种NLP任务,可用于文本生成、摘要等任务。
- 教程链接: GPT-J 入门教程
AllenNLP
- GitHub链接: https://github.com/allenai/allennlp
- Star数量: 22k+
- 主要功能: NLP研究框架,提供丰富的NLP模型和工具。
- 项目特点: 基于PyTorch,提供多种NLP模型实现,支持模型训练和评估,丰富的文档和教程。
- 教程链接: AllenNLP 入门教程
Detectron2
- GitHub链接: https://github.com/facebookresearch/detectron2
- Star数量: 21k+
- 主要功能: 目标检测和分割框架。
- 项目特点: 由Facebook AI Research开发,支持多种目标检测和分割模型,模块化设计,易于扩展,提供预训练模型。
- 教程链接: Detectron2 入门教程
Fairseq
- GitHub链接: https://github.com/facebookresearch/fairseq
- Star数量: 19k+
- 主要功能: 序列到序列建模工具包,专注于机器翻译。
- 项目特点: 由Facebook AI Research开发,支持多种序列生成任务,提供预训练模型,高性能实现。
- 教程链接: Fairseq 入门教程
MLflow
- GitHub链接: https://github.com/mlflow/mlflow
- Star数量: 18k+
- 主要功能: 机器学习生命周期管理工具。
- 项目特点: 跟踪实验和模型,模型部署和管理,支持多种机器学习框架,易于集成到现有工作流。
- 教程链接: MLflow 入门教程
ONNX
- GitHub链接: https://github.com/onnx/onnx
- Star数量: 17k+
- 主要功能: 开放神经网络交换格式,用于模型互操作性。
- 项目特点: 跨框架模型交换,支持多种深度学习框架,优化模型推理,广泛的行业支持。
- 教程链接: ONNX 入门教程
MXNet
- GitHub链接: https://github.com/apache/mxnet
- Star数量: 17k+
- 主要功能: 深度学习框架,注重效率和灵活性。
- 项目特点: Apache基金会项目,高效的符号编程和命令式编程,支持多种编程语言,良好的分布式训练支持。
- 教程链接: MXNet 入门教程
JAX
- GitHub链接: https://github.com/google/jax
- Star数量: 16k+
- 主要功能: 机器学习研究库,提供自动微分和JIT编译。
- 项目特点: 由Google开发,高效的自动微分,JIT编译加速,支持NumPy API,适合研究和实验。
- 教程链接: JAX 入门教程
Transformers.js
- GitHub链接: https://github.com/xenova/transformers.js
- Star数量: 15k+
- 主要功能: 在浏览器和Node.js中运行Transformer模型。
- 项目特点: 基于ONNX Runtime,支持多种预训练模型,无需服务器端依赖,适合前端应用。
- 教程链接: Transformers.js 入门教程
PyTorch Lightning
- GitHub链接: https://github.com/Lightning-AI/lightning
- Star数量: 15k+
- 主要功能: PyTorch的高级封装,简化深度学习训练。
- 项目特点: 简化训练代码,支持分布式训练,提供多种训练功能,易于扩展。
- 教程链接: PyTorch Lightning 入门教程
Streamlit
- GitHub链接: https://github.com/streamlit/streamlit
- Star数量: 14k+
- 主要功能: 快速构建机器学习和数据科学Web应用。
- 项目特点: 简单易用的API,快速原型开发,支持多种可视化,适合数据科学和机器学习应用。
- 教程链接: Streamlit 入门教程
Flair
- GitHub链接: https://github.com/flairNLP/flair
- Star数量: 13k+
- 主要功能: NLP库,专注于序列标记和文本分类。
- 项目特点: 基于PyTorch,支持多种语言模型,易于使用的API,提供预训练模型,适合序列标记任务。
- 教程链接: Flair 入门教程
Triton
- GitHub链接: https://github.com/openai/triton
- Star数量: 12k+
- 主要功能: GPU编程框架,简化GPU代码开发。
- 项目特点: 由OpenAI开发,简化GPU编程,高性能实现,适合深度学习和科学计算。
- 教程链接: Triton 入门教程
Label Studio
- GitHub链接: https://github.com/heartexlabs/label-studio
- Star数量: 11k+
- 主要功能: 数据标注工具,支持多种数据类型。
- 项目特点: 支持多种数据类型,可定制的标注界面,支持团队协作,易于集成到现有工作流。
- 教程链接: Label Studio 入门教程
CLIP
- GitHub链接: https://github.com/openai/CLIP
- Star数量: 11k+
- 主要功能: 多模态模型,连接文本和图像。
- 项目特点: 由OpenAI开发,支持零样本学习,可用于图像分类、检索等任务,提供预训练模型。
- 教程链接: CLIP 入门教程
DALL-E Mini
- GitHub链接: https://github.com/borisdayma/dalle-mini
- Star数量: 10k+
- 主要功能: 文本到图像生成模型。
- 项目特点: 轻量级DALL-E实现,支持文本到图像生成,开源免费,可在消费级硬件上运行。
- 教程链接: DALL-E Mini 入门教程
Weights & Biases
- GitHub链接: https://github.com/wandb/wandb
- Star数量: 9k+
- 主要功能: 机器学习实验跟踪和可视化工具。
- 项目特点: 跟踪实验指标和参数,可视化训练过程,模型版本管理,支持团队协作。
- 教程链接: Weights & Biases 入门教程
LangChain
- GitHub链接: https://github.com/langchain-ai/langchain
- Star数量: 9k+
- 主要功能: 用于构建基于语言模型的应用程序。
- 项目特点: 支持多种语言模型,提供链式调用框架,支持多种数据源和工具,易于构建复杂的LLM应用。
- 教程链接: LangChain 入门教程
Stable Diffusion
- GitHub链接: https://github.com/Stability-AI/stablediffusion
- Star数量: 8k+
- 主要功能: 文本到图像生成模型。
- 项目特点: 开源文本到图像生成,高质量图像输出,支持多种生成任务,活跃的社区和扩展。
- 教程链接: Stable Diffusion 入门教程
ONNX Runtime
- GitHub链接: https://github.com/microsoft/onnxruntime
- Star数量: 8k+
- 主要功能: ONNX模型的推理引擎。
- 项目特点: 由Microsoft开发,高性能模型推理,支持多种硬件和平台,优化模型执行。
- 教程链接: ONNX Runtime 入门教程
The Annotated Transformer
- GitHub链接: https://github.com/harvardnlp/annotated-transformer
- Star数量: 7k+
- 主要功能: Transformer模型的详细注释实现。
- 项目特点: 详细的代码注释,易于理解的实现,适合学习Transformer原理,基于PyTorch。
- 教程链接: The Annotated Transformer 入门教程
LlamaIndex
- GitHub链接: https://github.com/run-llama/llama_index
- Star数量: 25k+
- 主要功能: 构建基于私有数据的RAG系统的开源框架。
- 项目特点: 高度模块化,支持多种文档格式和向量数据库,易于集成,丰富的生态系统。
- 教程链接: LlamaIndex 入门教程
Haystack
- GitHub链接: https://github.com/deepset-ai/haystack
- Star数量: 13k+
- 主要功能: 端到端的RAG框架,专注于构建高质量的问答系统和文档检索应用。
- 项目特点: 模块化设计,支持多种向量数据库和LLM模型,生产就绪,活跃的社区。
- 教程链接: Haystack 入门教程
AnythingLLM
- GitHub链接: https://github.com/Mintplex-Labs/anything-llm
- Star数量: 7k+
- 主要功能: 基于RAG的知识库和AI助手,支持多用户管理和AI Agent功能。
- 项目特点: 开源免费,易于部署,功能丰富,界面友好,高度可定制。
- 教程链接: AnythingLLM 入门教程
MaxKB
- GitHub链接: https://github.com/1Panel-dev/MaxKB
- Star数量: 5k+
- 主要功能: 智能知识库和AI助手,实现高效的文档检索和问答功能。
- 项目特点: 开源免费,易于使用,功能丰富,高度可扩展,性能优化。
- 教程链接: MaxKB 入门教程
Dify
- GitHub链接: https://github.com/langgenius/dify
- Star数量: 15k+
- 主要功能: AI应用开发平台,支持RAG、AI Agent和工作流功能。
- 项目特点: 开源免费,易于使用,功能丰富,高度可扩展,企业级特性。
- 教程链接: Dify 入门教程
FastGPT
- GitHub链接: https://github.com/labring/FastGPT
- Star数量: 10k+
- 主要功能: 快速部署的AI知识库和聊天机器人,支持多模型集成和自定义工作流。
- 项目特点: 开源免费,易于部署,功能丰富,高度可扩展,性能优化。
- 教程链接: FastGPT 入门教程
RagFlow
- GitHub链接: https://github.com/infiniflow/ragflow
- Star数量: 5k+
- 主要功能: 高效的RAG系统,实现智能文档检索和问答功能。
- 项目特点: 开源免费,易于使用,功能丰富,高度可扩展,性能优化。
- 教程链接: RagFlow 入门教程
Weaviate
- GitHub链接: https://github.com/weaviate/weaviate
- Star数量: 13k+
- 主要功能: 开源向量数据库,支持高效的语义搜索和推荐系统。
- 项目特点: 开源免费,高性能,易于使用,高度可扩展,多语言支持。
- 教程链接: Weaviate 入门教程
PG Vector
- GitHub链接: https://github.com/pgvector/pgvector
- Star数量: 10k+
- 主要功能: PostgreSQL的向量扩展,支持在PostgreSQL中存储和查询向量数据。
- 项目特点: 开源免费,高性能,易于集成,可靠性,灵活性。
- 教程链接: PG Vector 入门教程
Chroma
- GitHub链接: https://github.com/chroma-core/chroma
- Star数量: 12k+
- 主要功能: 轻量级向量数据库,支持高效的语义搜索和推荐系统。
- 项目特点: 开源免费,轻量级,易于使用,高性能,灵活性。
- 教程链接: Chroma 入门教程
如何使用本专区
- 浏览项目: 通过左侧导航栏选择你感兴趣的项目。
- 学习教程: 点击项目链接进入详细教程,了解项目的基本概念和使用方法。
- 实践应用: 跟随教程中的示例代码,尝试在自己的项目中使用这些AI框架。
贡献指南
如果你发现了值得推荐的AI开源项目,或者对本专区的内容有任何建议,欢迎提交贡献!