主页
分类
标签
归档
主页
分类
标签
归档
AI 常用术语
AI 常用术语 记录一些AI常用术语 机器学习 任务 回归(Regression):预测连续型变量的值,如股票预测 分类(Classification):预测离散型变量的类别,如图像分类 聚类(Clustering):将数据划分为不同的组别,使得组内的相似性最大化,组间的相似性最小化,例如客户细分、图像分割 降维(Dimensionality Reduction):减少数据的...
2025-02-05
ai
ai
阅读全文
Diffusion
Diffusion 扩散原理 生成模型的目标是:给定一组数据,构建一个分布,生成新的数据 一种思想是,从一个简单的分布开始(如果高斯分布),将其转化到目标分布 扩散模型正是这样的框架,将一个复杂抽样,转化为一系列简单抽样。其核心就是学习反转很多中间步骤会更简单 高斯扩散 Gaussian Diffusion 对于一个满足目标分布(尽管这个分布当下还是未知的)的随机变量$x_0$,我们为他...
2025-01-17
ai
ai
阅读全文
微调大模型
微调大模型 Llama3 import transformersimport torchmodel_id = "meta-llama/Meta-Llama-3.1-8B-Instruct"pipeline = transformers.pipeline( "text-generation", model=model_id, model...
2024-10-30
ai
ai
阅读全文
WSL 深度学习环境搭建
WSL 深度学习环境搭建 Win11,N卡 很多人只有一台Windows电脑,装双系统很麻烦,尤其是一个有N卡驱动的Linux,而WSL2环境搭建非常方便 之前有写过一篇Linux入门,但是内容记的太杂了,这里精简一下 安装WSL2 在Windows Terminal(如果没有,去微软的store中下载)中输入 wsl --install 默认会安装一个最新的Ubuntu 安装GCC...
2024-10-30
ai
ai
阅读全文
强化学习
强化学习 跟同事聊了一会强化学习做AI游戏,感觉难度很大很麻烦,遂断更 游戏的奖励频率过低,电子游戏很难像围棋那样计算每一步的收益,就像训狗一样,你让狗坐下给一次奖励,训练效果会很好,但让狗做非常多复杂的组合动作再给一次奖励,就很难训练 数据难以收集,AI玩游戏通常是现有一个游戏,再去做AI,这些AI公司一般都没有与游戏公司合作,于是难以拿到原始的状态同步信息,只能抓取屏幕提取参数,难以...
2024-10-07
ai
ai
阅读全文
OpenAI API
OpenAI API 我这里使用的Step开放平台,其API与OpenAI兼容 Python可以使用openai库轻松调用一些大模型服务,对Agent工程师来说非常有用 对话 from openai import OpenAI client = OpenAI(api_key="xxxxx", base_url="https://api.stepfun.com...
2024-09-13
ai
ai
阅读全文
PyTorch学习记录
PyTorch学习记录 PyTorch是一个Python机器学习框架 基础语法 张量 Tensors Tensors很像矩阵、向量,在PyTorch中使用Tensors编码输入和输出 构造 import torchimport numpy as np# 直接构造data = [[1, 2],[3, 4]]x_data = torch.tensor(data)# 使用numpy array...
2024-03-30
ai
ai
阅读全文