我是一名专注于 AI 模型训练与工程落地的工程师,日常与大量数据和各种模型打交道。从数据清洗、模型训练到推理优化、线上部署,这条链路上的每个环节我都踩过不少坑。
写这个博客的初衷很简单——把自己踩过的坑写出来,也许能帮到有同样困扰的人。内容主要围绕深度学习、LLM 微调、MLOps 工程实践,偶尔也会写写独立开发的一些思考。
不定期更新,不追热点,只写真实遇到过的问题。不喝浓茶,也不喝咖啡——能写到深夜,全凭真的有东西想说。如果某篇文章帮到了你,欢迎来聊聊。🙌
部分已落地的 AI 工程项目
基于 YOLOv8 训练的产品表面缺陷检测模型,mAP@0.5 达 94.2%,已部署至产线实时推理。
对 Qwen2 进行 LoRA 微调,构建特定行业知识库问答系统,幻觉率较基座模型降低 60%。
基于 Transformer 架构的多变量时序预测模型,相比传统统计方法 MAE 降低 35%。