以下是我的文本文件数据的样子:
1名阿比盖尔·塞尔策
6019 8 St NW
华盛顿特区-20011
未就业,未就业
6019 8 St. . NW
华盛顿特区-20011
信用卡03/11/2022 $10,000.00 $10,00.00
2 Danita Cole
416牧羊人圣NW
华盛顿特区-20005
未就业,未就业
谢泼德街西北416号
华盛顿特区-20011
信用卡03/11/2022 $100.00 $350.00
兰登·詹姆斯3
612金塔纳Pl NW
华盛顿特区-20011
社会包容经理Brookfield Properties
纽约大街655号
华盛顿特区-20000
信用卡03/11/2022 $100.00 $100.00
为了清楚起见,每次在名称(1 Abigail,2 Danita)之前都有一个数字,接下来的6行没有空行,然后在下一个编号条目之前的第7行之后有一个空行(在‘Card 03/11/2022 $10,000.00 $10,00.00’和'2 Danita‘之间)。所以在'1 Abigail Seltzer‘和'6019 8 St NW’之间没有空行。
我想将每个分组行放入自己的7列中--因为每一组7的列都会增长,因此:
column1 1 Abigail Seltzer 2 Danita Cole 3 Landon James
column2 6019 8 St NW 416牧羊人St 612 Quintana Pl NW
第3栏华盛顿特区20011华盛顿特区20005华盛顿特区20000
诸若此类。
谢谢!
发布于 2022-05-04 08:42:05
您可以使用readLines读取文本文件,并将生成的向量转换为8行的矩阵。当您转换此矩阵时,您的所有字段都将有它们自己的列。
t(matrix(readLines("../mytext.txt"), nrow = 8))
#> [,1] [,2] [,3]
#> [1,] "1 Abigail Seltzer" "6019 8th St NW" "Washington, DC-20011"
#> [2,] "2 Danita Cole" "416 Shepherd St NW" "Washington, DC-20005"
#> [3,] "3 Landon James" "612 Quintana Pl NW" "Washington, DC-20011"
#> [,4]
#> [1,] "Not Employed Not Employed"
#> [2,] "Not Employed Not Employed"
#> [3,] "Social Inclusion Manager Brookfield Properties"
#> [,5] [,6]
#> [1,] "6019 8th St. NW" "Washington,DC-20011"
#> [2,] "416 Shepherd Street NW" "Washington,DC-20011"
#> [3,] "655 New York Ave NW" "Washington,DC-20000"
#> [,7] [,8]
#> [1,] "Credit Card 03/11/2022 $100.00 $100.00" ""
#> [2,] "Credit Card 03/11/2022 $100.00 $350.00" ""
#> [3,] "Credit Card 03/11/2022 $100.00 $100.00" "" 如果愿意,可以使用as.data.frame将其转换为数据框架。
https://stackoverflow.com/questions/72109984
复制相似问题