抱歉,您的浏览器无法访问本站
本页面需要浏览器支持(启用)JavaScript
了解详情 >

强化学习 跟同事聊了一会强化学习做AI游戏,感觉难度很大很麻烦,遂断更 游戏的奖励频率过低,电子游戏很难像围棋那样计算每一步的收益,就像训狗一样,你让狗坐下给一次奖励,训练效果会很好,但让狗做非常多复杂的组合动作再给一次奖励,就很难训练 数据难以收集,AI玩游戏通常是现有一个游戏,再去做AI,这些AI公司一般都没有与游戏公司合作,于是难以拿到原始的状态同步信息,只能抓取屏幕提取参数,难以...
ai

OpenAI API 我这里使用的Step开放平台,其API与OpenAI兼容 Python可以使用openai库轻松调用一些大模型服务,对Agent工程师来说非常有用 对话 from openai import OpenAI client = OpenAI(api_key="xxxxx", base_url="https://api.stepfun.com...
ai

扩散模型玩DOOM 《Diffusion Models Are Real-Time Game Engines》 近期谷歌发布了一个用AI玩DOOM的工作,由两部分组成。一个是基于强化学习玩游戏,一个是基于扩散模型生成游戏画面 INTRODUCTION 电子游戏运行时在loop,每个loop由三部分组成: 监听输入 更新游戏状态 渲染画面 可交互的世界模拟不只是一个高帧率视频生成,还需...
ai

Tensorboard 使用 Tensorboard是一个用于监控训练过程的UI 安装 pip install tensorboard 启动 找到训练的log文件夹,找到一个形如events.out.tfevents.xxxx.xxx.xxx.x的文件,运行 tensorboard --logdir=log/xxxx 会启动一个服务,访问这个链接就可以查看当前训练信息 如果训练在服务器中,可...
ai

ControlNet ControlNet是在Stable Diffusion模型上添加辅助模块,添加额外条件来控制AI绘图过程 ControlNet将SD模型复制两份,一份锁定,一份使用额外数据进行微调,最后将两份合并绘图。于是我们可以使用少量图片实现微调,同时保持SD数十亿张图的训练效果 参数介绍 运行你的SD,在浏览器打开xxx:port/docs即可查看SD的Fast API ...
ai

AI 常用术语 刚刚加入AI公司,听组会听的头都大了,沟通过程中很多术语都不了解,于是简单学习记录一下 机器学习 Ground Truth 真实值 ACC Accuracy 准确率=正确预测数/总样本数 Loss 损失 Epoch 在模型训练过程中,数据集被完整遍历一遍的过程 Overfit 过拟合 SOTA State of the Art 表示在某个特定领域中的最好成果、最佳实践...
ai

PyTorch学习记录 PyTorch是一个Python机器学习框架 基础语法 张量 Tensors Tensors很像矩阵、向量,在PyTorch中使用Tensors编码输入和输出 构造 import torchimport numpy as np# 直接构造data = [[1, 2],[3, 4]]x_data = torch.tensor(data)# 使用numpy array...
ai