首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >OpenCV的cvMat的内存结构是什么?

OpenCV的cvMat的内存结构是什么?
EN

Stack Overflow用户
提问于 2009-11-11 03:53:10
回答 1查看 15.6K关注 0票数 15

想象一下,我有以下几点:

代码语言:javascript
复制
CvMat* mat = cvCreateMat(3,3,CV_16SC3)

这是通道3的整数的3x3矩阵。

现在,如果您查看OpenCV文档,您会发现以下是cvMat的减速:

代码语言:javascript
复制
typedef struct CvMat {

int type;
int step;

int* refcount;

union
{
    uchar* ptr;
    short* s;
    int* i;
    float* fl;
    double* db;
} data;

union
{
    int rows;
    int height;
};

union
{
    int cols;
    int width;
};
} CvMat;

现在,我想使用data.ptr,它是指向存储在cvMat中的数据的指针。然而,我很难理解内存是如何布局的。如果我有一个3通道矩阵,这是如何工作的?对于一个通道,它很简单,因为它只是MxN的一个简单矩阵,其中M是行,N是科尔。然而对于3通道,这些MxN矩阵中有3条吗?有人能告诉我如何通过data.ptr实现3通道矩阵的无效化,以及如何访问这些值吗?谢谢。

EN

回答 1

Stack Overflow用户

发布于 2009-11-11 05:14:33

本网页是对OpenCV 1.1的出色介绍。我建议使用最新版本的开放CV 2.0,它有一个通用的Mat类来处理图像、矩阵等,这与OpenCV 1.1不同。

上面的网页详细介绍了在多通道图像中访问元素的下列方法:

间接访问:(一般的,但低效的,访问任何类型的映像)

对于多通道浮点(或字节)图像:

代码语言:javascript
复制
IplImage* img=cvCreateImage(cvSize(640,480),IPL_DEPTH_32F,3);
CvScalar s;
s=cvGet2D(img,i,j); // get the (i,j) pixel value
printf("B=%f, G=%f, R=%f\n",s.val[0],s.val[1],s.val[2]);
s.val[0]=111;
s.val[1]=111;
s.val[2]=111;
cvSet2D(img,i,j,s); // set the (i,j) pixel value

直接访问:(高效访问,但容易出错)

对于多通道浮点图像:

代码语言:javascript
复制
IplImage* img=cvCreateImage(cvSize(640,480),IPL_DEPTH_32F,3);
((float *)(img->imageData + i*img->widthStep))[j*img->nChannels + 0]=111; // B
((float *)(img->imageData + i*img->widthStep))[j*img->nChannels + 1]=112; // G
((float *)(img->imageData + i*img->widthStep))[j*img->nChannels + 2]=113; // R

使用指针的直接访问:(在有限的假设下简化和有效访问)

对于多通道浮点图像(假设4字节对齐):

代码语言:javascript
复制
IplImage* img  = cvCreateImage(cvSize(640,480),IPL_DEPTH_32F,3);
int height     = img->height;
int width      = img->width;
int step       = img->widthStep/sizeof(float);
int channels   = img->nChannels;
float * data    = (float *)img->imageData;
data[i*step+j*channels+k] = 111;

使用包装器的c++直接访问:(简单有效的访问)

为单通道字节图像、多通道字节图像和多通道浮动图像定义一个c++包装:

代码语言:javascript
复制
template<class T> class Image
  {
    private:
    IplImage* imgp;
    public:
    Image(IplImage* img=0) {imgp=img;}
    ~Image(){imgp=0;}
    void operator=(IplImage* img) {imgp=img;}
    inline T* operator[](const int rowIndx) {
      return ((T *)(imgp->imageData + rowIndx*imgp->widthStep));}
  };

  typedef struct{
    unsigned char b,g,r;
  } RgbPixel;

  typedef struct{
    float b,g,r;
  } RgbPixelFloat;

  typedef Image<RgbPixel>       RgbImage;
  typedef Image<RgbPixelFloat>  RgbImageFloat;
  typedef Image<unsigned char>  BwImage;
  typedef Image<float>          BwImageFloat;

对于多通道浮点图像:

代码语言:javascript
复制
IplImage* img=cvCreateImage(cvSize(640,480),IPL_DEPTH_32F,3);
RgbImageFloat imgA(img);
imgA[i][j].b = 111;
imgA[i][j].g = 111;
imgA[i][j].r = 111;
票数 19
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/1712899

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档