设为首页收藏本站

EPS数据狗论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 1820|回复: 0

MATLAB读取txt文件的方法

[复制链接]

18

主题

209

金钱

307

积分

入门用户

发表于 2019-3-29 15:12:51 | 显示全部楼层 |阅读模式
一、如何读取一个文档下,多个txt文件?
一般读取的文件,命名都具有一定的规律,除去相同部分,剩下的变化按照时间、序号、某一特定的标志符等进行排列。
下面我们举个例子来操作。

假如文件夹里存在以下文件:
cs20170701
cs20170702
cs20170703
cs20170704

cs20170731

标签:cs代表产品类型,数字代表年月日。总共31个文件
意义:整个生产部门在2017年7月份的生产记录表
分析内容:首先我们观察所有的文件,它们具有相同部分:产品类型和年月,变化的部分只有日子数,那么,我们就可以使用一个循环来读取所有的txt文件,且保存得有规律。
参考函数:loadtextread  num2str

解决方案:
  1. data=cell(1,31);%创建一个储存空间
  2. for num=1:9
  3.         if num<10
  4.                 data{num}=textread(['cs2017070' num2str(num) '.txt']);%将每日的数据分别存在一个cell空间内
  5.         else
  6.                 data{num}=textread(['cs201707' num2str(num) '.txt']);
  7.         end
  8. end
复制代码


二、一个txt文件里全是数字数据的读取?
例如sq.txt文件内容为:
1 20.1 574 21
2 7541 12 24
3 45 21 45
4 32 12 54.2.
5 35.1 45.0 45.0

标签:数字1为编号,数字2、3、4,分别为长、宽、高
分析内容:这是最典型的纯数字文件,我们仅需读取数字就行了。
参考函数:load

解决方案:
  1. load sq.txt
复制代码


三、在问题二的基础上存在第一行数据为中文?
例如sq2.txt文件内容为:
编号 长 宽 高
1 20.1 574 21
2 7541 12 24
3 45 21 45
4 32 12 54.2
5 35.1 45.0 45.0

标签:同问题2
分析内容:这里的文件内容,存在了一行中文汉字,load函数将不再适用,这里我们需要分为两个部分处理:1、中文处理;2、数字处理。
参考函数:textreadimportdata

解决方案:
方案一
  1. data=textread('sq2.txt','%s');%读取文件
  2. data=str2num(char(data(5:end)));%删除中文,并将cell转换成数字
  3. data=reshape(data,4,length(data)/4)';%重新按照格式排列
复制代码


方案二
  1. data=importdata('sq2.txt');%读取的文字存在struct内,data为数字,textdata为中文
  2. data=data.data;%提取struct中的data。
复制代码


四、读取中文与数字混合文件?
一般此种文件格式为: 中文1:xxx, 中文2:xxx, 中文3:xxx,

例如sq3.txt文件内容为:
编号:1 长:20.1 宽:574 高:21
编号:2 长:7541 宽:12 高:24
编号:3 长:45 宽:、21 高:45
编号:4 长:32 宽:12 高:54.2
编号:5 长:35.1 宽:45.0 高:45.0

标签:
分析内容:这种固定的汉字和变化的数字,以形成汉字和数字混合出现,已经不能简单应用MATLAB自带函数处理,需要根据实际情况进行更加精准的处理。这里使用文件系统函数(fopen等函数)读取文件(与C语言读取文本相同),这方面的文件或经验,百度搜索有一大堆,我只分享一下它的最关键部分。
关键函数:
fopen 打开文件,返回地址,因为我们只是读取文件,所以用r权限
fscanf  以某种方式读取文件,具体内容具体分析
fscanf(FID,FORMAT,SIZEA)
FID为文件地址,为fopen的返回值
FORMAT为读取txt文件的格式。(重点,具体问题具体分析)
SIZEA为读取的函数,如:[1 inf] 读取从第一行到最后一行
fclose 关闭文件
PS:这里的三个函数缺一不可(养成良好习惯,打开的文件要关闭)

解决方案:
  1. <p>fid=fopen('sq3.txt','r');%只读
  2. data=fscanf(fid,'编号:%d 长:%f 宽:%f 高:%f\n',[1 inf]);%按照读取文件的标准格式来写
  3. fclose(fid);%关闭
  4. data=reshape(data,4,length(data)/4)';%重新按照格式排列
  5. </p>
复制代码


五、文件内容存在缺损(1)?
在某些产品检测时,得到的数据可能存在缺损值,即某个标签下的值不存在。
例如sq4.txt文件内容为:
    123.1,754,124,12,57
13,754.5,124,12,57.7
23,754,124.2,12,
12,754,,12,57.8
13,754,12.4,12,57
12.5,754,124,12,57.6

标签:每行总共5个数字,分别代表5个属性,分别用逗号隔开。但是因为某些原因,存在缺损值,缺损值也是有逗号隔开了的。第三行缺第5个值,第四行缺第3个值
分析内容:这种缺损值,只是简单的数字值缺损,结构简单,缺损值少。
关键函数:importdata

解决方案:
  1. data=importdata('sq4.txt');%缺损的值将用NaN补全。
复制代码


六、文件内容存在缺损(2)?
较之问题五,问题六的数据成分更加复杂。

例如sq4.txt文件内容为:
    10:21:54,123.1,754,124,,57,10/24,a
10:21:56,13,754.5,124,12,57.7,21/54,b
10:21:58,23,754,124.2,12,,20/64,
10:21:59,12,754,,12,57.8,21/24,a
10:22:01,13,754,12.4,12,57,,
10:22:02,12.5,754,124,12,57.6,22/54,b

标签:总共存在8个属性,分别逗号隔开,属性1为时间 例如:10:21:54  10点21分54秒
分析内容:这是一组成分复杂且带有缺损值的文件,每组数据具有一定规律但又存在差异,这种情况也是MATLAB自带函数所不能轻易解决的,且若使用文件系统函数,也将变得非常繁琐,这里将使用另一种方式:正则表达式。百度’正则表达式’,其它地方也有很多的学习资料,但是大多数地方都存在一个特点:讲解得很全面。伴随之存在着缺点:内容繁多而且复杂,且我们没必要了解这么多。这里我就针对读取txt文件,只介绍我们需要的关键东西。
关键函数: regexp
x=regexp(str1,str2);  str1表示原字符串,str2表示分割标志符 x表示匹配到的位置

解决方案:
我们先分析一组数据
10:21:54,123.1,754,124,,57,10/24,a
数据格式: 数据1,数据2,数据3,数据4,数据5,数据6,数据7,数据8
分析得知每个数据以逗号隔开,数据内容不限也可能为空,我们就可以以逗号为分割符将数据拆分开,如果相邻逗号位置相减为1,则该数据为空。
  1. <p>clear;clc;
  2. data1=textread('cs20170704.txt','%s');%读取出所有的内容
  3. num=8;%总共8个数据
  4. data=cell(length(data1),num);%创建最后的存储空间
  5. str=',';%分割标志符
  6. for n=1:length(data1)
  7.     addr=regexp(data1(n),str);%找到所有逗号位置
  8.     addr=cell2mat(addr);%regexp返回值为cell类型,此变为mat
  9.     data{n,1}=data1{n}(1:addr(1)-1);%数据1 时间不存在缺损,单独提出来
  10.     for m=2:num-1%数据2-7
  11.         if addr(m)-addr(m-1)==1%相邻逗号相减为1
  12.             data{n,m}=NaN;%空
  13.         else
  14.             data{n,m}=data1{n}(addr(m-1)+1:addr(m)-1);%数据非空 (前面逗号-1)到(后面逗号+1)
  15.         end
  16.     end
  17.     if addr(7)==length(data1{n})%数据8 最后一个数据单独提出来
  18.         data{n,8}=NaN;%空
  19.     else
  20.         data{n,8}=data1{n}(addr(7)+1:end);%数据非空
  21.     end
  22. end</p><p>data
  23. </p>
复制代码


您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

客服中心
关闭
在线时间:
周一~周五
8:30-17:30
QQ群:
653541906
联系电话:
010-85786021-8017
在线咨询
客服中心

意见反馈|网站地图|手机版|小黑屋|EPS数据狗论坛 ( 京ICP备09019565号-3 )   

Powered by BFIT! X3.4

© 2008-2028 BFIT Inc.

快速回复 返回顶部 返回列表