首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >生成C中的幂律分布并使用python进行测试。

生成C中的幂律分布并使用python进行测试。
EN

Stack Overflow用户
提问于 2017-08-14 22:47:51
回答 1查看 450关注 0票数 1

我知道,对于产生均匀分布的随机数的随机变量,一种获得类幂数据的方法是:沃尔夫拉姆·马西尔如下:y是在(0,1)中均匀分布的随机变量,另一个随机变量分布为P(x) = C*x**n (对于x在(xmin,xmax)中)。我们有

代码语言:javascript
复制
x=[ (xmax**(n+1) - xmin**(n-1))y+xmin**(n+1)  ]**(1/(n+1))

因此,我用C语言编写了这个程序,生成从1到100的50k数字,应该以x^(-2)的形式分发,并在文件DATA.txt上打印结果的频率:

代码语言:javascript
复制
void random_powerlike(int *k, int dim,  double degree, int xmin, int xmax, unsigned int *seed)
{
int i; 
double aux;
for(i=0; i<dim; i++)
    {
    aux=(powq(xmax, degree +1 ) - powq(xmin, degree +1 ))*((double)rand_r(seed)/RAND_MAX)+ powq(xmin, degree +1);

    k[i]=(int) powq(aux, 1/(degree+1));

    }
}

int main()
{
    unsigned int seed = 1934123471792583;

    FILE *tmp; 
    char  stringa[50];
    sprintf(stringa, "Data.txt");
    tmp=fopen(stringa, "w");

    int dim=50000;
    int *k;
    k= (int *) malloc(dim*sizeof(int));
    int degree=-2;
    int freq[100];  

    random_powerlike(k,dim, degree, 1,100,&seed);
    fprintf(tmp, "#degree = %d  x=[%d,%d]\n",degree,1,100);
    for(int j=0; j< 100;j++)
    {   
        freq[j]=0;
        for(int i = 0; i< dim; ++i)
        {
            if(k[i]==j+1)
            freq[j]++;
        }
        fprintf(tmp, "%d    %d\n", j+1, freq[j]);
    }
    fflush(tmp);
    fclose(tmp);

return 0;
}

我决定用pylab来拟合这些数字,看看适合它们的最佳幂律是否为a*x**b,b= -2。我用python编写了这个程序:

代码语言:javascript
复制
import numpy
from scipy.optimize import curve_fit
import pylab

num, freq = pylab.loadtxt("Data.txt", unpack=True)
freq=freq/freq[0]

def funzione(num, a,b):
    return a*num**(b)

pars, covm =  curve_fit(funzione, num, freq, absolute_sigma=True)
xx=numpy.linspace(1, 99)
pylab.plot(xx, funzione(xx, pars[0],pars[1]), color='red')
pylab.errorbar(num, freq, linestyle='', marker='.',color='black')
pylab.show()
print pars

问题是,当我拟合数据时,我得到了一个指数值~-1.65。

我想我在什么地方犯了个错误,但我不知道它在哪里。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2017-08-14 23:28:05

我觉得你得做个直方图。我刚刚重写了你的代码,现在很适合了

代码语言:javascript
复制
#include <math.h>
#include <stdlib.h>
#include <string.h>
#include <stdio.h>

double rndm() {
    return (double)rand()/(double)RAND_MAX;
}

double power_sample(double xmin, double xmax, int degree) {
    double pmin = pow(xmin, degree + 1);
    double pmax = pow(xmax, degree + 1);
    double v = pmin + (pmax - pmin)*rndm();
    return pow(v, 1.0/(degree + 1));
}

int main() {
    unsigned int seed = 32345U;
    srand(seed);

    int xmin = 1;
    int xmax = 100;

    double* hist = malloc((xmax-xmin + 1)*sizeof(double));
    memset(hist, 0, (xmax-xmin + 1)*sizeof(double));

    // sampling
    int nsamples = 100000000;
    for(int k = 0; k != nsamples; ++k) {
        double v = power_sample(xmin, xmax, 2);
        int idx = (int)v;
        hist[idx] += 1.0;
    }

    // normalization
    for(int k = xmin; k != xmax; ++k) {
        hist[k] /= (double)nsamples;
    }

    // output
    for(int k = xmin; k != xmax; ++k) {
        double x = k + 0.5;
        printf(" %e     %e\n", x, hist[k]);
    }

    free(hist); // cleanup

    return 0;
}

拟合码

代码语言:javascript
复制
import numpy
from scipy.optimize import curve_fit
import pylab

def funzione(x, a,b):
    return a * numpy.power(x, b)

num, freq = pylab.loadtxt("q.dat", unpack=True)

pars, covm =  curve_fit(funzione, num, freq, absolute_sigma=True)
pylab.plot(num, funzione(num, pars[0], pars[1]), color='red')
pylab.errorbar(num, freq, linestyle='', marker='.',color='black')
pylab.show()
print(pars)

它产生了

代码语言:javascript
复制
[  3.00503372e-06   1.99961571e+00]

非常接近

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/45684123

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档