2024 年下半年,AI 的浪潮扑面而来。那时的我还只是偶尔关注,直到 2025 年春节期间 — DeepSeek-V3 的重磅开源,引爆了整个互联网。那一刻,我意识到:AI 已经不再是“未来”,而是真真切切地来到我们身边。
正是在那个春节,我所在的技术交流群发起了一个翻译倡议:《ACPI_Spec_6_5_Aug29.pdf》和《UEFI_Spec_2_9_2021_03-18.pdf》两本专业书籍需要志愿者合作翻译。于是,我写下了第一个 AI 翻译辅助脚本 aitranslator,显著提升了翻译效率。翻译小组对 AI 的高效能力普遍评价积极。我也在知乎写了一篇文章 《我用 DeepSeekV3 做技术翻译》,那是我第一次真切感受到 AI 的“落地价值”。
有点正向反馈之后后,我开始试探摸索:追逐 arXiv 最新论文、守候各路博主的新视频、尝试各种 AI 工具和模型……
我在 HuggingFace、ModelScope 等平台上试验模型;折腾过 Ollama、vLLM、LangChain 等本地部署;薅过阿里百炼、Google Colab 的免费 GPU;写过脚本、啃过《动手学深度学习》《强化学习的数学原理》《机器学习》。
然而,信息的洪流让我逐渐迷失:技术太多,根本学不完;学习路径是否正确、所学是否能真正落地,也让我不断自我怀疑。
在关注业界动态时,我发现生态正快速补全:
- 有人专注于 Workflow(n8n、dify、coze)
- 有人深耕 Agent(我也曾浅度参与开源 MoFa 项目)
- 越来越多团队尝试通过 MCP 协议推动多智能体协作,探索更通用的 AGI 能力。
显而易见,软件领域的创新正在飞速演进。与此同时,我开始思考:我的独特价值在哪里?
作为一名嵌入式软件工程师,我本身具备硬件基础。这让我意识到:硬件与 AI 的结合,或许才是属于我的独特探索轨迹。
于是,在 AI 的协助下,我开始了一些跨界尝试:
- 搭建家庭空气质量检测系统,用 LLM 多模态驱动图像识别、前端展示、AI Vide Coding。
- 绘制语音模块的 PCB 板,制作带有 AI 交互功能的玩具原型。
- 深度思考居身智能,寻求可行的商业模式,尝试自己的独立商业。
这些实践让我更加坚信,AI 并不只是停留在软件层面,它完全可以与硬件结合,创造新的可能性。同时,这也可能是自身原有能力最大化的必须的选择。
尽管如此,理论学习仍然不可或缺。首推以下学习资料:
书籍、课程:
- 李沐:动手学深度学习 电子书网站、B站配套视频
- 李宏毅(台大教授):Machine Learning 2025Spring、2023Spring、Generative AI 2024Spring;Youtube频道
免费练习GPU资源:
- Google Colab:有免费的GPU、TPU资源可以使用。Google Colab 非常适合 入门和练习机器学习、LLM,特别是想学习 PyTorch、TensorFlow、Hugging Face 等框架的同学。它降低了学习成本,让你专注于理解算法和实验,而不是环境配置或硬件投入。等你积累经验后,可以考虑迁移到更专业的 GPU 云服务(如 GCP、AWS、Paperspace、RunPod)以进行更大规模的训练。
- 阿里百炼:新注册用户可以领取3个月,每个月250计算时,用于使用平台的GPU资源;是一款功能全面、开发便捷、安全可靠的大模型服务平台。无论是模型调用、训练微调、应用开发,还是智能体编排与流程自动化,它都提供了成熟的一体化工具和部署路径,是企业和开发者快速上马生成式 AI 应用的利器。
模型数据集托管平台:
- Huggingface:Hugging Face 是 AI 开发者和研究者的核心平台,融合了模型开发、共享、部署与演示功能,并凭借生态完整性和开放社区文化,推动 AI 研究和应用。
- ModelScope:ModelScope 是阿里云打造的功能全面、拥有丰富资源与开源生态的 AI 模型开发平台。它为开发者和企业提供了从模型探索、训练到部署的一站式工具链,并注重易用性与社区协作。对于希望快速进行模型试验、构建应用原型、甚至迈向 Agent 或文本视频生成的开发者而言,是一个极具吸引力的平台。
主流LLM平台:
Github高星项目
- awesome-llm-apps:构建应用的示例。一个精心整理的采用 RAG、AI 智能体、多智能体团队、MCP、语音代理等技术构建的精选 LLM 应用集合。收录了使用 OpenAI、Anthropic、Google 等商业模型及 DeepSeek、Qwen 或 Llama 等可在本地运行的开源模型的 LLM 应用案例。
- awesom-mcp-servers:此列表重点关注可用于生产和实验性的 MCP 服务器,这些服务器通过文件访问、数据库连接、API 集成和其他上下文服务来扩展 AI 功能。
构建应用的平台:
生产力工具:
- Cursor:Cursor IDE,国内封禁
- Cluade Code
- Trae:字节AI IDE
- Figma:设计届的ChatGPT
开源知识社区
- WayToAGI:国内最大的AI应用知识社区,活跃度很高,每月有线下活动。
理论与实践相辅相成,让我在探索 AI 的道路上更加踏实。回望这半年多的学习实践,我从一个技术拾荒者,在信息洪流中跌跌撞撞,逐渐找到了属于自己的独特方向。
未来,我会继续沿着 硬件 + AI 这条路,探索更多有意义的可能性。
写在最后:其实还是要感谢2014年以前,读研究生期间,导师安排我做理论研究,至少对于优化理论、矩阵运算、随机过程、马尔科夫链等等知识还是有一定的基础,所以学习深度学习,还是有一些可以复用的知识点,而不至于完全是天书。你所遇到的一切,都有可能很有用。