首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >微软的计算机视觉API或谷歌的云视觉API有可能获得对象的位置吗?

微软的计算机视觉API或谷歌的云视觉API有可能获得对象的位置吗?
EN

Stack Overflow用户
提问于 2016-12-23 20:56:21
回答 5查看 1.2K关注 0票数 4

我正在尝试开发一个应用程序,它需要知道标记对象在图像中的位置。知道图像中有“钢琴”是不够的,我需要知道钢琴在图像中的位置。

微软的计算机视觉API和谷歌的云视觉API都提供了某种形式的剪切建议/智能缩略图生成服务,这让我认为正在检测到某些对象的位置--然而,是否有办法从Microsoft的计算机视觉API或Google的云视觉API中获取这些信息(就像每个检测到的对象周围的边框)?

编辑:我知道这两个API都可以返回图像中检测到的面孔的位置,但是我正在寻找图像中每个对象的位置和大小:汽车、钢琴、树、people...anything。

EN

回答 5

Stack Overflow用户

发布于 2016-12-23 21:06:35

Microsoft没有为检测到的对象提供像素坐标(请参见返回功能:https://dev.projectoxford.ai/docs/services/56f91f2d778daf23d8ec6739/operations/56f91f2e778daf14a499e1fa)。

但是,如果要检测人员,Microsoft可以返回脸矩形的坐标。

票数 0
EN

Stack Overflow用户

发布于 2017-04-25 10:59:33

此时,我不知道为对象提供坐标的任何API。我建议使用的是YOLO,它为您提供对象的坐标。你可以使用预先训练过的模特,也可以训练自己的。

但是,它不是API,您必须编写一些后端代码才能在远程运行。

票数 0
EN

Stack Overflow用户

发布于 2019-10-11 12:00:39

希望这能帮到你https://azure.microsoft.com/en-in/services/cognitive-services/computer-vision/

API:

代码语言:javascript
复制
url:- (In POST) https://{yourvisionapp}.cognitiveservices.azure.com/vision/v2.0/detect
headers:- Content-Type: application/json
Ocp-Apim-Subscription-Key : {yourSubscriptionKey}
body:- {"url":"yoururl"}

样本回应:-

代码语言:javascript
复制
{
    "objects": [
        {
            "rectangle": {
                "x": 460,
                "y": 79,
                "w": 141,
                "h": 258
            },
            "object": "window",
            "confidence": 0.508
        },
        {
            "rectangle": {
                "x": 180,
                "y": 240,
                "w": 299,
                "h": 182
            },
            "object": "Billiard table",
            "confidence": 0.635,
            "parent": {
                "object": "table",
                "confidence": 0.676
            }
        },
        {
            "rectangle": {
                "x": 8,
                "y": 11,
                "w": 497,
                "h": 416
            },
            "object": "room",
            "confidence": 0.547
        }
    ],
    "requestId": "f8aafd95-d17d-4088-a34b-ad616f9cde4a",
    "metadata": {
        "width": 640,
        "height": 427,
        "format": "Jpeg"
    }
}
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/41307758

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档