文章/答案/技术大牛

发布

社区首页 >问答首页 >部分-可观测连接-4

问部分-可观测连接-4
EN

Code Golf用户

提问于 2018-09-10 11:24:22

回答 1查看 710关注 0票数 8

游戏

你将玩一个(几乎)标准的连接-4游戏。不幸的是，这是一个通信游戏，有人把黑色磁带放在每第二行从底部开始，这样你就不能看到你的对手的任何移动在这些行。

任何已满栏内的移动都将算作通过你的回合，如果一个游戏运行的时间超过6 * 7回合，它将被判定为平局。

挑战规范

您的程序应该实现为Python3函数。第一个参数是板子的“视图”，将已知的棋盘状态表示为从下到上的二维行列表，其中1是第一个玩家的移动，2是第二个玩家的移动，0是一个空位置或对手的隐藏移动。

第二个参数是一个从0索引的转弯号码，它的奇偶值告诉你你是哪个玩家。

最后一个参数是一个任意状态，在每个游戏开始时初始化为None，您可以使用它在两回合之间保留状态。

您应该返回您想要播放的列索引的两个元组，并返回下一个回合要返回的新状态。

评分

一场胜利算作+1，一场平局算作0，一场失败算作-1。你的目标是在循环赛中达到最高的平均分数.我将尝试运行尽可能多的比赛，以确定一个明确的赢家。

规则

任何竞争对手最多应该有一个竞争的机器人在任何时候，但它是可以更新你的条目，如果你做了改进。请尽量将你的机器人限制在每一个回合的思考时间为1秒。

测试

下面是控制器的源代码，以及一些非竞争性的示例机器人供参考：

import itertools
import random

def get_strides(board, i, j):
    yield ((i, k) for k in range(j + 1, 7))
    yield ((i, k) for k in range(j - 1, -1, -1))
    yield ((k, j) for k in range(i + 1, 6))
    yield ((k, j) for k in range(i - 1, -1, -1))
    directions = [(1, 1), (-1, -1), (1, -1), (-1, 1)]
    def diag(di, dj):
        i1 = i
        j1 = j
        while True:
            i1 += di
            if i1 < 0 or i1 >= 6:
                break
            j1 += dj
            if j1 < 0 or j1 >= 7:
                break
            yield (i1, j1)
    for d in directions:
        yield diag(*d)

DRAWN = 0
LOST = 1
WON = 2
UNDECIDED = 3

def get_outcome(board, i, j):
    if all(board[-1]):
        return DRAWN
    player = board[i][j]
    strides = get_strides(board, i, j)
    for _ in range(4):
        s0 = next(strides)
        s1 = next(strides)
        n = 1
        for s in (s0, s1):
            for i1, j1 in s:
                if board[i1][j1] == player:
                    n += 1
                    if n >= 4:
                        return WON
                else:
                    break
    return UNDECIDED

def apply_move(board, player, move):
    for i, row in enumerate(board):
        if board[i][move] == 0:
            board[i][move] = player
            outcome = get_outcome(board, i, move)
            return outcome
    if all(board[-1]):
        return DRAWN
    return UNDECIDED

def get_view(board, player):
    view = [list(row) for row in board]
    for i, row in enumerate(view):
        if i % 2:
            continue
        for j, x in enumerate(row):
            if x == 3 - player:
                row[j] = 0
    return view

def run_game(player1, player2):
    players = {1 : player1, 2 : player2}
    board = [[0] * 7 for _ in range(6)]
    states = {1 : None, 2 : None}
    for turn in range(6 * 7):
        p = (turn % 2) + 1
        player = players[p]
        view = get_view(board, p)
        move, state = player(view, turn, states[p])
        outcome = apply_move(board, p, move)
        if outcome == DRAWN:
            return DRAWN
        elif outcome == WON:
            return p
        else:
            states[p] = state
    return DRAWN

def get_score(counts):
    return (counts[WON] - counts[LOST]) / float(sum(counts))

def run_tournament(players, rounds=10000):
    counts = [[0] * 3 for _ in players]
    for r in range(rounds):
        for i, player1 in enumerate(players):
            for j, player2 in enumerate(players):
                if i == j:
                    continue
                outcome = run_game(player1, player2)
                if outcome == DRAWN:
                    for k in i, j:
                        counts[k][DRAWN] += 1
                else:
                    if outcome == 1:
                        w, l = i, j
                    else:
                        w, l = j, i
                    counts[w][WON] += 1
                    counts[l][LOST] += 1
        ranks = sorted(range(len(players)), key = lambda i: get_score(counts[i]), reverse=True)
        print("Round %d of %d\n" % (r + 1, rounds))
        rows = [("Name", "Draws", "Losses", "Wins", "Score")]
        for i in ranks:
            name = players[i].__name__
            score = get_score(counts[i])
            rows.append([name + ":"] + [str(n) for n in counts[i]] + ["%6.3f" % score])
        lengths = [max(len(s) for s in col) + 1 for col in zip(*rows)]
        for i, row in enumerate(rows):
            padding = ((n - len(s)) * ' ' for s, n in zip(row, lengths))
            print(''.join(s + p for s, p in zip(row, padding)))
            if i == 0:
                print()
        print()

def random_player(view, turn, state):
    return random.randrange(0, 7), state

def constant_player(view, turn, state):
    return 0, state

def better_random_player(view, turn, state):
    while True:
        j = random.randrange(0, 7)
        if view[-1][j] == 0:
            return j, state

def better_constant_player(view, turn, state):
    for j in range(7):
        if view[-1][j] == 0:
            return j, state

players = [random_player, constant_player, better_random_player, better_constant_player]

run_tournament(players)

KoTHing快乐！

临时结果

Name                    Draws Losses Wins  Score  

zsani_bot:              40    5377   94583  0.892 
better_constant_player: 0     28665  71335  0.427 
constant_player:        3     53961  46036 -0.079 
normalBot:              38    64903  35059 -0.298 
better_random_player:   192   71447  28361 -0.431 
random_player:          199   75411  24390 -0.510

king-of-the-hill

python

board-game

回答 1

Code Golf用户

发布于 2018-10-10 22:26:46

normalBot的假设是，中间的点比末端的点更有价值。因此，它使用以中间为中心的正态分布来确定其选择。

def normalBot(view, turn, state):
    randomNumber = round(np.random.normal(3, 1.25))
    fullColumns = []
    for i in range(7):
        if view[-1][i] != 0:
            fullColumns.append(i)
    while (randomNumber > 6) or (randomNumber < 0) or (randomNumber in fullColumns):
        randomNumber = round(np.random.normal(3, 1.25))
    return randomNumber, state

票数 2

页面原文内容由Code Golf提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://codegolf.stackexchange.com/questions/171933

复制

相似问题

问部分-可观测连接-4
EN

挑战规范

评分

规则

测试

临时结果

回答 1

Code Golf用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问部分-可观测连接-4EN

挑战规范

评分

规则

测试

临时结果

回答 1

Code Golf用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问部分-可观测连接-4
EN