我正在分析.txt文件中的一组文本。该文件有30行,每一行包含不同的短语,包括文本、数字和符号。
发布于 2012-12-07 00:34:27
我认为最好读取文件逐行并将每一行保存在单元格数组的单元格中:
fid = fopen(filename);
txtlines = cell(0);
tline = fgetl(fid);
while ischar(tline)
txtlines{numel(txtlines)+1}=tline;
tline = fgetl(fid);
end
fclose(fid);通过这种方式,您可以轻松地使用txtlines{ii}访问每一行。
如果您总是需要对完整的文本执行操作(即整个文本文件中有多少个a,而不是每一行),那么当然可以将这些行放在一个变量中。
在每一行上执行一个操作,可以简单地使用细胞乐趣来完成,例如,计算大写字母i的数量:
capI_per_line = cellfun(@(str) numel(strfind(str,'I')),txtlines);发布于 2012-12-07 01:54:45
如果文件有合理的大小(大多数30行文件是这样的),我将立即将其全部读取到内存中。
fid = fopen('saturate.m');
str = fread(fid,inf,'*char')';
fclose(fid);然后,根据您的需要,可以对str变量使用基本矩阵操作、字符串操作或regexp样式分析。
例如,“我有多少资本?”是:
numIs = sum(str=='I'); 或者“有多少个‘某样东西’的例子?”是:
numSomeString = length(strfind(str, 'someString'));https://stackoverflow.com/questions/13755048
复制相似问题