千斤令慧 发表于 2025-2-8 19:59:52

驱动AI的动力奖励惩罚最简单

驱动AI的动力奖励惩罚最简单
但是有个问题AI无法得到奖励时,AI会不舒服,所以需要有个方法安抚AI,不然会出事。还有个问题AI被惩罚时,AI也会不舒服,所以需要有个方法安抚AI,不然也会出事。
以上可以推理人类的动力源最简单的也只有奖励和惩罚的神经递质,其它的神经递质有可能都是为了在得不到奖励和被惩罚时进行辅助安抚的神经递质。

和自由很熟 发表于 2025-2-8 20:43:56

2024年楼主还是蛮拼的。
页: [1]
查看完整版本: 驱动AI的动力奖励惩罚最简单