Hyperlane大模型

eastspire2025/11/29大约 2 分钟hyperlane-ai

本项目提供了一个完整的流水线，用于微调语言模型并将其转换为 GGUF 格式以实现高效推理。

项目概述

该流水线包括以下步骤：

git clone <repository-url>
cd hyperlane-ai-training

执行主脚本来运行完整的流水线：

./run.sh

这将：

为了在开发过程中更快地迭代，您可以运行开发模式的流水线，该模式限制训练步数：

./run.sh dev

项目可以使用根目录中的 .env 文件进行配置。以下环境变量可用：

示例 .env 文件：

MERGED_MODEL_DIR=my_merged_model
OUTPUT_DIR=my_output

项目需要以下 Python 包：

成功执行后，最终的 GGUF 模型将位于: $OUTPUT_DIR/$OUTPUT_DIR.gguf

本项目采用 MIT 许可证进行授权。详情请参阅 LICENSE 文件。

欢迎贡献！如有问题请提交 Issue 或发起 Pull Request。

如有任何疑问，请通过邮箱 [email protected] 联系作者。

加载中...