百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 编程字典 > 正文

使用Python和OpenCV在线打乒乓球

toyiye 2024-06-21 11:55 14 浏览 0 评论


我最喜欢的YouTuber之一,CodeBullet,曾经尝试创建一个乒乓球 AI来统治所有人。

这似乎是一个非常有趣且简单的任务,所以我也想尝试一下。在这篇文章中,我将概述一些我考虑过的因素,如果你希望在任何类似的项目上工作,这些因素可能会有所帮助,并且我想我会尝试其中的一些其他工作,因此,如果你喜欢这种类型的事情,可以关注我。

使用计算机视觉的好处是,我可以使用已经构建的游戏并处理图像。话虽如此,我们将使用与ponggame.org上使用的那个与CodeBullet相同的游戏版本。它还具有2人模式,因此我可以与自己的AI对抗;我做到了,这确实很难……

捕捉屏幕

第一件事就是捕捉屏幕。我想确保我的帧速率尽可能快,为此我发现MSS是一个很棒的python包。有了这个,我很容易达到60帧/秒的最高速度,与 PIL 相比,我只能得到大约20帧每秒。它以 numpy 数组的形式返回。

Paddle detection

为了简单起见,我们需要定义paddle 的位置。这可以用几种不同的方法来完成,但我认为最明显的是对每个Paddle的区域进行遮罩,然后运行连接的组件来找到Paddle对象。下面是一段代码:

def get_objects_in_masked_region(img, vertices,  connectivity = 8):
    ''':return connected components with stats in masked region
    [0] retval number of total labels 0 is background
    [1] labels image
    [2] stats[0] leftmostx, [1] topmosty, [2] horizontal size, [3] vertical size, [4] area
    [3] centroids
    '''
    mask = np.zeros_like(img)
    # fill the mask
    cv2.fillPoly(mask, [vertices], 255)
    # now only show the area that is the mask
    mask = cv2.bitwise_and(img, mask)
    conn = cv2.connectedComponentsWithStats(mask, connectivity, cv2.CV_16U)
    return conn

在上面,“vertices”只是定义遮罩区域的坐标列表。一旦在每个区域内有了对象,我就可以得到它们的质心位置或边界框。需要注意的一点是OpenCV将背景作为任何连接的组件列表中的第0个对象,因此在本例中,我总是获取第二大的对象。结果如下——右边绿色质心的球拍是玩家 / 即将成为人工智能控制的球拍。

移动paddle

现在我们有了输出,我们需要一个输入。为此,我求助于一个有用的包和其他人的代码 。

它使用ctypes来模拟键盘按下,在这种情况下,游戏是用“k”和“m”键来玩的。我这里有扫描码。在测试了它只是随机上下移动后,我们就可以开始跟踪了。

乒乓球检测

下一步是识别并跟踪乒乓球。同样,这可以用几种方法来处理——其中一种可能是通过使用模板进行对象检测,然而,我再次使用了连接的组件和对象属性,即乒乓球的区域,因为它是唯一具有尺寸的对象。

我知道每当乒乓球穿过或碰到其他白色物体时,我都会遇到问题,但我也认为只要我能在大多数时间里追踪到它,这一切都没问题。毕竟,它是直线运动的。如果你看下面的视频,你会看到标记乒乓球的红色圆圈是如何闪烁的。这是因为它只在每2帧中找到一个。在60帧/秒时,这并不重要。

反弹预测的光线投射

在这一点上,我们已经有一个可工作的人工智能。如果我们只是移动球员的球拍,使其处于与乒乓球相同的y轴位置,它的效果相当不错。然而,当乒乓球得到良好的反弹时,它确实会遇到问题。球拍太慢了,跟不上,需要预测乒乓球的位置,而不是仅仅移动到当前的位置。这已经在上面的剪辑中实现了,下面是两种方法的比较。

差别并不大,但如果选择了正确的人工智能,这绝对是一场更稳定的胜利。为此,我首先为乒乓球创建了一个位置列表。为了公平起见,我把这个列表的长度控制在5个,基本上可以做到。列表不要太长,否则要花更长的时间才能发现它改变了方向。在得到位置列表后,我使用简单的矢量平均法来平滑并得到方向矢量——如绿色箭头所示。这也被标准化成一个单位向量,然后乘以一个长度以方便可视化。

投射光线只是这个的延伸——使前向投影变长。然后我检查了未来的位置是否在顶部和底部区域的边界之外。如果是这样的话,它只是将位置投影回游戏区域。对于左侧和右侧,它计算出与paddle的x位置相交的位置,并将x和y位置固定到该点。这样可以确保paddle指向正确的位置。如果没有这一点,它通常会走得太远。下面是定义光线的代码,该光线可以预测乒乓球的未来位置:

def pong_ray(pong_pos, dir_vec, l_paddle, r_paddle, boundaries, steps = 250):
    future_pts_list = []
    for i in range(steps):
        x_tmp = int(i * dir_vect[0] + pong_pos[0])
        y_tmp = int(i * dir_vect[1] + pong_pos[1])

        if y_tmp > boundaries[3]: #bottom
            y_end = int(2*boundaries[3] - y_tmp)
            x_end = x_tmp

        elif y_tmp < boundaries[2]: #top
            y_end = int(-1*y_tmp)
            x_end = x_tmp
        else:
            y_end = y_tmp

        ##stop where paddle can reach
        if x_tmp > r_paddle[0]: #right
            x_end = int(boundaries[1])
            y_end = int(pong_pos[1] + ((boundaries[1] - pong_pos[0])/dir_vec[0])*dir_vec[1])

        elif x_tmp < boundaries[0]: #left
            x_end = int(boundaries[0])
            y_end = int(pong_pos[1] + ((boundaries[0] - pong_pos[0]) / dir_vec[0]) * dir_vec[1])

        else:
            x_end = x_tmp

        end_pos = (x_end, y_end)
        future_pts_list.append(end_pos)

    return future_pts_list

在上面,也许不太明显的计算方法是确定paddle对目标的左或右位置的截距。我们基本上是通过相似三角形来实现的,图片和方程如下所示。我们知道在边界中给定的paddle的x位置的截距。然后我们可以计算出乒乓球将移动多远,并将其添加到当前的y位置。

paddle虽然看起来笔直,但实际上有一个弯曲的反弹面。也就是说,如果你用球拍向两端击球,球会反弹,就像球拍有角度一样。因此,我允许球拍击中边缘,这增加了人工智能的攻击性,使乒乓球四处飞舞。

结论

尽管是为这种特定的乒乓球实现而设计的,但是相同的概念和代码也可以用于任何版本——只需要改变一些预处理步骤。当然,另一种方法是通过强化学习或简单的conv-net使用机器学习,但我喜欢这种经典方法;至少在这种情况下,我不需要健壮的通用性或困难的图像处理步骤。正如我提到的,这个版本的乒乓球是2人,老实说我无法打败我自己的AI…

相关推荐

为何越来越多的编程语言使用JSON(为什么编程)

JSON是JavascriptObjectNotation的缩写,意思是Javascript对象表示法,是一种易于人类阅读和对编程友好的文本数据传递方法,是JavaScript语言规范定义的一个子...

何时在数据库中使用 JSON(数据库用json格式存储)

在本文中,您将了解何时应考虑将JSON数据类型添加到表中以及何时应避免使用它们。每天?分享?最新?软件?开发?,Devops,敏捷?,测试?以及?项目?管理?最新?,最热门?的?文章?,每天?花?...

MySQL 从零开始:05 数据类型(mysql数据类型有哪些,并举例)

前面的讲解中已经接触到了表的创建,表的创建是对字段的声明,比如:上述语句声明了字段的名称、类型、所占空间、默认值和是否可以为空等信息。其中的int、varchar、char和decimal都...

JSON对象花样进阶(json格式对象)

一、引言在现代Web开发中,JSON(JavaScriptObjectNotation)已经成为数据交换的标准格式。无论是从前端向后端发送数据,还是从后端接收数据,JSON都是不可或缺的一部分。...

深入理解 JSON 和 Form-data(json和formdata提交区别)

在讨论现代网络开发与API设计的语境下,理解客户端和服务器间如何有效且可靠地交换数据变得尤为关键。这里,特别值得关注的是两种主流数据格式:...

JSON 语法(json 语法 priority)

JSON语法是JavaScript语法的子集。JSON语法规则JSON语法是JavaScript对象表示法语法的子集。数据在名称/值对中数据由逗号分隔花括号保存对象方括号保存数组JS...

JSON语法详解(json的语法规则)

JSON语法规则JSON语法是JavaScript对象表示法语法的子集。数据在名称/值对中数据由逗号分隔大括号保存对象中括号保存数组注意:json的key是字符串,且必须是双引号,不能是单引号...

MySQL JSON数据类型操作(mysql的json)

概述mysql自5.7.8版本开始,就支持了json结构的数据存储和查询,这表明了mysql也在不断的学习和增加nosql数据库的有点。但mysql毕竟是关系型数据库,在处理json这种非结构化的数据...

JSON的数据模式(json数据格式示例)

像XML模式一样,JSON数据格式也有Schema,这是一个基于JSON格式的规范。JSON模式也以JSON格式编写。它用于验证JSON数据。JSON模式示例以下代码显示了基本的JSON模式。{"...

前端学习——JSON格式详解(后端json格式)

JSON(JavaScriptObjectNotation)是一种轻量级的数据交换格式。易于人阅读和编写。同时也易于机器解析和生成。它基于JavaScriptProgrammingLa...

什么是 JSON:详解 JSON 及其优势(什么叫json)

现在程序员还有谁不知道JSON吗?无论对于前端还是后端,JSON都是一种常见的数据格式。那么JSON到底是什么呢?JSON的定义...

PostgreSQL JSON 类型:处理结构化数据

PostgreSQL提供JSON类型,以存储结构化数据。JSON是一种开放的数据格式,可用于存储各种类型的值。什么是JSON类型?JSON类型表示JSON(JavaScriptO...

JavaScript:JSON、三种包装类(javascript 包)

JOSN:我们希望可以将一个对象在不同的语言中进行传递,以达到通信的目的,最佳方式就是将一个对象转换为字符串的形式JSON(JavaScriptObjectNotation)-JS的对象表示法...

Python数据分析 只要1分钟 教你玩转JSON 全程干货

Json简介:Json,全名JavaScriptObjectNotation,JSON(JavaScriptObjectNotation(记号、标记))是一种轻量级的数据交换格式。它基于J...

比较一下JSON与XML两种数据格式?(json和xml哪个好)

JSON(JavaScriptObjectNotation)和XML(eXtensibleMarkupLanguage)是在日常开发中比较常用的两种数据格式,它们主要的作用就是用来进行数据的传...

取消回复欢迎 发表评论:

请填写验证码