<rss xmlns:atom="http://www.w3.org/2005/Atom" version="2.0">
    <channel>
        <title>自博弈 - 标签 - 一峰的记录</title>
        <link>https://www.simplife.tech/tags/%E8%87%AA%E5%8D%9A%E5%BC%88/</link>
        <description>自博弈 - 标签 - 一峰的记录</description>
        <generator>Hugo -- gohugo.io</generator><language>zh-cn</language><lastBuildDate>Sun, 30 Nov 2025 22:01:52 &#43;0800</lastBuildDate><atom:link href="https://www.simplife.tech/tags/%E8%87%AA%E5%8D%9A%E5%BC%88/" rel="self" type="application/rss+xml" /><item>
    <title>尝试强化学习训练卡牌对战 AI 的失败尝试</title>
    <link>https://www.simplife.tech/posts/rl-card-ai-failed-experiment/</link>
    <pubDate>Sun, 30 Nov 2025 22:01:52 &#43;0800</pubDate>
    <author>一峰</author>
    <guid>https://www.simplife.tech/posts/rl-card-ai-failed-experiment/</guid>
    <description><![CDATA[<h2 id="一为什么想做这件事">一、为什么想做这件事</h2>
<p>当前线上跑着的机器人有不同等级，最弱的是从左到右费用够就出牌的固定规则模式，最强的是设定了一些收益参数，每次出牌会选择收益最高的牌的模式，还人工加入了 combo 组合的检测和连续打出。</p>]]></description>
</item>
</channel>
</rss>
