まず、知人のファイル操作。
はじめに:
今、この世界は、あなたがすべてのソフトウェアファイルがなどの単語、WPS、として、なくなっている動作することができた場合、その後、あなたの友人がQQあなたのファイルを与える送ってくれた、ファイル名は次のとおりです。美しいモデルスチュワーデス看護師お問い合わせ.TXT、ここでのすべての少年たちは、あなたがこの文書を受け取った後、インパルスの痕跡があるかどうか、あなたの心は、もちろん、彼らはMensaoの人々が、実際には、我々はもっと興味があるようなものではありません、ただ唯一、内部に書かれているものを見たいですより多くの何も、絶対に触れないでください。しかし、私は全て消えて、すべてのファイル操作ソフトと言うことができ、あなたはああ、必死に、心に傷を付け100本の爪ではありません。そう心配しないで、あなたはそれを忘れてしまったら?あなたは、プログラミング言語としてPythonを学びました、この言語は確かに、ファイルの機能を制御することができます。私はあなたが、学ぶことができなければならないことができ、この強力な力を信じています。
さて、私は今、あなたはあなたがそれを必要とするパラメータものを考える必要があり、ファイルを操作するためのソフトウェアを開発するためのPythonを使用することができます、と仮定しますか?
ファイルのパス:D:\美しいモデルスチュワーデスナースコンタクト.TXT(操作したいファイルを、私たちは、このファイルの場所を知っている必要があります)
エンコード:UTF-8、GB2312、GBK ....( 昨日終了したばかりのコーディング、実際には、ファイルのデータストレージ、あなたはどのようなコーディングに格納された符号化データを知っておく必要があるデータストレージ)
動作モードは:読み取り専用、書き込み専用、追加、読み取りと書き込み、書き込みを読んで....
三つの部分、コンピュータハードウェア、オペレーティングシステム、アプリケーション:コンピュータシステムが分割されます。 私たちは、あなたがデータの永久保存を鎮圧したい場合は、ハードウェアを動作させるためのアプリケーションはよく知られているが含まハードディスクに格納されなければならないPythonや他の言語で書かれたアプリケーションを使用して、アプリケーションがハードウェアに直接アクセスすることはできません、その使用オペレーティングシステムに。オペレーティングシステムは、ファイルは、アプリケーション・プログラムへのオペレーティングシステムであるユーザー/アプリケーションの用途にシンプルなインターフェイスにパッケージング複雑なハードウェアの操作は、あなたが自分自身のデータを永久に保存することができるハードディスク仮想概念、ファイルを操作することにより、ユーザやアプリケーションプログラムを動作させます。
この時点で、中に(可能なパスが単純でありな限り)だけで何かを書き、その後、任意のディスクに保存され、ファイルを作成するためのソフトウェアを使用する必要があります。
次に、ファイルを開くには、Pythonのコードを使用して、PYファイルを作成します。
F =オープン( 'D:若い女性の看護師\ LORIが.txtで'、MODE = 'R&LT'、エンコード= 'UTF-8') のコンテンツに達し、f.read =() 印刷(コンテンツ) f.close() 結果: タイトルがあります良いです
:次上記コードの説明である Fが可変され、それは典型的には、F、f_obj、ファイル、f_handler、書き込まれる FH、 等を、そのファイルハンドルと呼ばれています。 オープン:オペレーティングシステム(WindowsやLinuxなど)Pythonの関数を呼び出しています。 「D:\若い女性看護師LORIは、.txtでは」:これは、ファイルへのパスです。 モード:運転のあなたのモードを定義するには、次のとおりです。Rモードをお読みください。 エンコーディング:ない特定のエンコードやデコード、彼は文です:何、この使用を開いてファイルをエンコードします。一般的には:あなたのファイルは、通常はUTF-8(一部使用GBK)で、どのような方法で開いたものをエンコード保存します。 f.read():あなたはファイルハンドルで操作しなければならないなど、このようなファイルを読み込むなどのファイルを操作するファイルの内容を書きたいと思います。 近い():ファイルハンドルクローズ(ファイルハンドルがスペース、メモリ内のこの空間の存在として理解することができるが、我々はシャットダウンするためのイニシアチブをとる必要があります)。
ファイルの概念によって、我々はハードドライブの動作の詳細を検討する行く必要はありません、単にファイル操作の過程に焦点を当てる必要があります:
#1ファイルを開き、変数にファイルハンドルと割り当てを得る F =オープン(「A.TXT」、 R「」、エンコード=「UTF-8」)#のデフォルトのオープンモードはR&LT上にある ファイル・ハンドルが#2。運転 データ=達し、f.read() #。3. 閉じるファイル f.close()
上記のコード、可能性のある問題を練習:
1.経路問題。
このファイルは、それはあなたのファイルパスが間違っている可能性がある、見つかりませんでした。
あなたのパス\文字の内側以降は「化学反応」のいくつかの種類を持っていた、この時間\で、このスクリーンショットの\ Dは\、\ Dは\ tのと、実際には、特別な意味を持つことになります、パスの区切り文字ではありませんこのような状況のために、あなたが解決しなければならないので、nは、ラインは、同様に壊れます:
解決策:「C:\\ Users \ユーザーJinxin \デスクトップ\\ 111.txt」化学反応のパスが発生した場合はいつでも、もう一つは\これは\は、翻訳の背面に、\の前にある、ただシンプルにしたいコンピュータに伝えますそれだけで\パスを表します。
二つの解決策:R'C:\\ Users \ユーザーjinxinの\デスクトップ\\全体のパスの前に111.txt」プラスR。(推奨)
相対パスと絶対パス:
1.絶対パス:ファイル名まで、ディスクのルートディレクトリから始まります
2.相対パス:私たちは一つのフォルダを使用している場合は、ファイル、フォルダ、ファイルがある場合は、同じ用語に位置している現在のプログラムからのファイルの相対は、比較的ロードキングはファイル名です../相対パスの下には、ファイル名に直接書き込むことができます。
2.コーディングの問題
問題は、オープンコーディングとエンコーディングファイルは、このエンコーディングの不整合で保存した場合に発生するということです。たとえば、ファイルをワードソフトで保存されたとき、ワードソフトウェアのデフォルトのエンコーディングはUTF-8ですが、Pythonコードを使用するときに開いている、GBKと、これはエラーになります。
読み込み、書き込み、追加:動作モードのファイル操作は3つのカテゴリに分類されています。各カテゴリにいくつかの具体的な方法、これらの方法は、次の我々の分類があります。
第二のファイル操作:読み取り
2.1 Rモード
読み取り専用ファイルを開いた、ファイルポインタはファイルの先頭に配置されます。これは、ファイルはrファイルを使用して、その後、デフォルトの動作モードをモードに設定されていない場合の動作の中で最も頻繁に使用されるモードは、デフォルトのモードです。
例えば:
F =オープン( 'パス1 /小さな子供の.txt'、MODE = 'R&LT'、エンコード= 'UTF-8') MSGは、f.read =()に達し f.close() 印刷(MSG) 結果: 高ラウンド イーフェイ セシリア ヤン・ジ フェイ
上記の例で見ることができ、私の小さな赤ちゃんの内容は、すべてのファイルがそれを読むことができますどのように読み、その後、この文書を読み出しますか?ここでは、ファイルの読み込みのさまざまな方法を見てください。
読む2.1.1()
リード()ファイルの内容を全て読み出す;欠点ファイルがメモリベンの崩壊につながりやすく、非常に大きなメモリフットプリントになります。
F =オープン( 'パス1 /小さな子供の.txt'、MODE = 'R&LT'、エンコード= 'UTF-8') MSGは、f.read =()に達し f.close() 印刷(MSG) 結果: 高ラウンド イーフェイ セシリア ヤン・ジ フェイ
2.1.2リード(N)
read()は読み取ったときに読むためにどのような位置指定します
モードRでは、n個に合わせて文字読みください。
f = open('path1/小娃娃.txt',mode='r',encoding='utf-8') msg = f.read(3) msg1 = f.read() f.close() print(msg) print(msg1) 结果: 高圆圆 刘亦菲 张柏芝 杨紫 王菲
2.1.3 readline()
readline()读取每次只读取一行,注意点:readline()读取出来的数据在后面都有一个\n
f = open('path1/小娃娃.txt',mode='r',encoding='utf-8') msg1 = f.readline() msg2 = f.readline() msg3 = f.readline() msg4 = f.readline() f.close() print(msg1) print(msg2) print(msg3) print(msg4) 结果: 高圆圆 刘亦菲 张柏芝 杨紫
解决这个问题只需要在我们读取出来的文件后边加一个strip()就OK了
f = open('path1/小娃娃.txt',mode='r',encoding='utf-8') msg1 = f.readline().strip() msg2 = f.readline().strip() msg3 = f.readline().strip() msg4 = f.readline().strip() f.close() print(msg1) print(msg2) print(msg3) print(msg4) 结果: 高圆圆 刘亦菲 张柏芝 杨紫
2.1.4 readlines()
readlines() 返回一个列表,列表里面每个元素是原文件的每一行,如果文件很大,占内存,容易崩盘。
f = open('log',encoding='utf-8') print(f.readlines()) f.close() # 结果['666666\n', 'fkja l;\n', 'fdkslfaj\n', 'dfsflj\n', 'df;asdlf\n', '\n', ]
上面这四种都太好,因为如果文件较大,他们很容易撑爆内存,所以接下来我们看一下第五种:
2.1.5 for循环
可以通过for循环去读取,文件句柄是一个迭代器,他的特点就是每次循环只在内存中占一行的数据,非常节省内存。
f = open('../path1/弟子规',mode='r',encoding='utf-8') for line in f: print(line) #这种方式就是在一行一行的进行读取,它就执行了下边的功能 print(f.readline()) print(f.readline()) print(f.readline()) print(f.readline()) f.close()
注意点:读完的文件句柄一定要关闭
2.2 rb模式
rb模式:以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。记住下面讲的也是一样,带b的都是以二进制的格式操作文件,他们主要是操作非文字文件:图片,音频,视频等,并且如果你要是带有b的模式操作文件,那么不用声明编码方式。
可以网上下载一个图片给同学们举例:
当然rb模式也有read read(n) readline(),readlines() for循环这几种方法,我在这就不一一演示了。
三. 文件操作:写
第二类就是写,就是在文件中写入内容。这里也有四种文件分类主要四种模式:w,wb,w+,w+b,我们只讲w,wb。
3.1 w模式
如果文件不存在,利用w模式操作文件,那么它会先创建文件,然后写入内容.
如果文件存在,利用w模式操作文件,先清空原文件内容,在写入新内容。
3.2 wb模式
wb模式:以二进制格式打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。一般用于非文本文件如:图片,音频,视频等。
举例说明:
我先以rb的模式将一个图片的内容以bytes类型全部读取出来,然后在以wb将全部读取出来的数据写入一个新文件,这样我就完成了类似于一个图片复制的流程。具体代码如下:
四. 文件操作:追加
第三类就是追加,就是在文件中追加内容。这里也有四种文件分类主要四种模式:a,ab,a+,a+b,我们只讲a。
4.1 a模式
打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。
如果文件不存在,利用a模式操作文件,那么它会先创建文件,然后写入内容。
如果文件存在,利用a模式操作文件,那么它会在文件的最后面追加内容。
五. 文件操作的其他模式
大家发现了没有,咱们还有一种模式没有讲,就是那种带+号的模式。什么是带+的模式呢?+就是加一个功能。比如刚才讲的r模式是只读模式,在这种模式下,文件句柄只能进行类似于read的这读的操作,而不能进行write这种写的操作。所以我们想让这个文件句柄既可以进行读的操作,又可以进行写的操作,那么这个如何做呢?这就是接下来要说这样的模式:r+ 读写模式,w+写读模式,a+写读模式,r+b 以bytes类型的读写模式.........
在这里咱们只讲一种就是r+,其他的大同小异,自己可以练练就行了。
#1. 打开文件的模式有(默认为文本模式): r ,只读模式【默认模式,文件必须存在,不存在则抛出异常】 w,只写模式【不可读;不存在则创建;存在则清空内容】 a, 只追加写模式【不可读;不存在则创建;存在则只追加内容】 #2. 对于非文本文件,我们只能使用b模式,"b"表示以字节的方式操作(而所有文件也都是以字节的形式存储的,使用这种模式无需考虑文本文件的字符编码、图片文件的jgp格式、视频文件的avi格式) rb wb ab 注:以b方式打开时,读取到的内容是字节类型,写入时也需要提供字节类型,不能指定编码 #3,‘+’模式(就是增加了一个功能) r+, 读写【可读,可写】 w+,写读【可写,可读】 a+, 写读【可写,可读】 #4,以bytes类型操作的读写,写读,写读模式 r+b, 读写【可读,可写】 w+b,写读【可写,可读】 a+b, 写读【可写,可读】
5.1 r+模式
r+: 打开一个文件用于读写。文件指针默认将会放在文件的开头。
注意:如果你在读写模式下,先写后读,那么文件就会出问题,因为默认光标是在文件的最开始,你要是先写,则写入的内容会讲原内容覆盖掉,直到覆盖到你写完的内容,然后在后面开始读取。
六. 文件操作的其他功能
6.1 read(n)
1. 文件打开方式为文本模式时,代表读取n个字符
2. 文件打开方式为b模式时,代表读取n个字节
6.2 seek()
seek(n)光标移动到n位置,注意: 移动单位是byte,所有如果是utf-8的中文部分要是3的倍数
通常我们使用seek都是移动到开头或者结尾
移动到开头:seek(0)
移动到结尾:seek(0,2) seek的第二个参数表示的是从哪个位置进行偏移,默认是0,表示开头,1表示当前位置,2表示结尾
f = open("小娃娃", mode="r+", encoding="utf-8") f.seek(0) # 光标移动到开头 content = f.read() # 读取内容, 此时光标移动到结尾 print(content) f.seek(0) # 再次将光标移动到开头 f.seek(0, 2) # 将光标移动到结尾 content2 = f.read() # 读取内容. 什么都没有 print(content2) f.seek(0) # 移动到开头 f.write("张国荣") # 写入信息. 此时光标在9 中文3 * 3个 = 9 f.flush() f.close()
6.3 tell()
使用tell()可以帮我们获取当前光标在什么位置
f = open("小娃娃", mode="r+", encoding="utf-8") f.seek(0) # 光标移动到开头 content = f.read() # 读取内容, 此时光标移动到结尾 print(content) f.seek(0) # 再次将光标移动到开头 f.seek(0, 2) # 将光标移动到结尾 content2 = f.read() # 读取内容. 什么都没有 print(content2) f.seek(0) # 移动到开头 f.write("张国荣") # 写入信息. 此时光标在9 中⽂文3 * 3个 = 9 print(f.tell()) # 光标位置9 f.flush() f.close()
6.4 readable(),writeable()
f = open('Test',encoding='utf-8',mode='r') print(f.readable()) # True print(f.writable()) # False content = f.read() f.close()
class TextIOWrapper(_TextIOBase): """ Character and line based layer over a BufferedIOBase object, buffer. encoding gives the name of the encoding that the stream will be decoded or encoded with. It defaults to locale.getpreferredencoding(False). errors determines the strictness of encoding and decoding (see help(codecs.Codec) or the documentation for codecs.register) and defaults to "strict". newline controls how line endings are handled. It can be None, '', '\n', '\r', and '\r\n'. It works as follows: * On input, if newline is None, universal newlines mode is enabled. Lines in the input can end in '\n', '\r', or '\r\n', and these are translated into '\n' before being returned to the caller. If it is '', universal newline mode is enabled, but line endings are returned to the caller untranslated. If it has any of the other legal values, input lines are only terminated by the given string, and the line ending is returned to the caller untranslated. * On output, if newline is None, any '\n' characters written are translated to the system default line separator, os.linesep. If newline is '' or '\n', no translation takes place. If newline is any of the other legal values, any '\n' characters written are translated to the given string. If line_buffering is True, a call to flush is implied when a call to write contains a newline character. """ def close(self, *args, **kwargs): # real signature unknown 关闭文件 pass def fileno(self, *args, **kwargs): # real signature unknown 文件描述符 pass def flush(self, *args, **kwargs): # real signature unknown 刷新文件内部缓冲区 pass def isatty(self, *args, **kwargs): # real signature unknown 判断文件是否是同意tty设备 pass def read(self, *args, **kwargs): # real signature unknown 读取指定字节数据 pass def readable(self, *args, **kwargs): # real signature unknown 是否可读 pass def readline(self, *args, **kwargs): # real signature unknown 仅读取一行数据 pass def seek(self, *args, **kwargs): # real signature unknown 指定文件中指针位置 pass def seekable(self, *args, **kwargs): # real signature unknown 指针是否可操作 pass def tell(self, *args, **kwargs): # real signature unknown 获取指针位置 pass def truncate(self, *args, **kwargs): # real signature unknown 截断数据,仅保留指定之前数据 pass def writable(self, *args, **kwargs): # real signature unknown 是否可写 pass def write(self, *args, **kwargs): # real signature unknown 写内容 pass def __getstate__(self, *args, **kwargs): # real signature unknown pass def __init__(self, *args, **kwargs): # real signature unknown pass @staticmethod # known case of __new__ def __new__(*args, **kwargs): # real signature unknown """ Create and return a new object. See help(type) for accurate signature. """ pass def __next__(self, *args, **kwargs): # real signature unknown """ Implement next(self). """ pass def __repr__(self, *args, **kwargs): # real signature unknown """ Return repr(self). """ pass buffer = property(lambda self: object(), lambda self, v: None, lambda self: None) # default closed = property(lambda self: object(), lambda self, v: None, lambda self: None) # default encoding = property(lambda self: object(), lambda self, v: None, lambda self: None) # default errors = property(lambda self: object(), lambda self, v: None, lambda self: None) # default line_buffering = property(lambda self: object(), lambda self, v: None, lambda self: None) # default name = property(lambda self: object(), lambda self, v: None, lambda self: None) # default newlines = property(lambda self: object(), lambda self, v: None, lambda self: None) # default _CHUNK_SIZE = property(lambda self: object(), lambda self, v: None, lambda self: None) # default _finalizing = property(lambda self: object(), lambda self, v: None, lambda self: None) # default 3.x
七. 打开文件的另一种方式
咱们打开文件都是通过open去打开一个文件,其实Python也给咱们提供了另一种方式:with open() as .... 的形式,那么这种形式有什么好处呢?
# 1,利用with上下文管理这种方式,它会自动关闭文件句柄。 with open('t1',encoding='utf-8') as f1: f1.read() # 2,一个with 语句可以操作多个文件,产生多个文件句柄。 with open('t1',encoding='utf-8') as f1,\ open('Test', encoding='utf-8', mode = 'w') as f2: f1.read() f2.write('老男孩老男孩')
这里要注意一个问题,虽然使用with语句方式打开文件,不用你手动关闭文件句柄,比较省事儿,但是依靠其自动关闭文件句柄,是有一段时间的,这个时间不固定,所以这里就会产生问题,如果你在with语句中通过r模式打开t1文件,那么你在下面又以a模式打开t1文件,此时有可能你第二次打开t1文件时,第一次的文件句柄还没有关闭掉,可能就会出现错误,他的解决方式只能在你第二次打开此文件前,手动关闭上一个文件句柄。
八. 文件的修改
文件的数据是存放于硬盘上的,因而只存在覆盖、不存在修改这么一说,我们平时看到的修改文件,都是模拟出来的效果,具体的说有两种实现方式:
方式一:将硬盘存放的该文件的内容全部加载到内存,在内存中是可以修改的,修改完毕后,再由内存覆盖到硬盘(word,vim,nodpad++等编辑器)
import os # 调用系统模块 with open('a.txt') as read_f,open('.a.txt.swap','w') as write_f: data=read_f.read() #全部读入内存,如果文件很大,会很卡 data=data.replace('alex','SB') #在内存中完成修改 write_f.write(data) #一次性写入新文件 os.remove('a.txt') #删除原文件 os.rename('.a.txt.swap','a.txt') #将新建的文件重命名为原文件
方式二:将硬盘存放的该文件的内容一行一行地读入内存,修改完毕就写入新文件,最后用新文件覆盖源文件
import os with open('a.txt') as read_f,open('.a.txt.swap','w') as write_f: for line in read_f: line=line.replace('alex','SB') write_f.write(line) os.remove('a.txt') os.rename('.a.txt.swap','a.txt')
コンテンツA.TXT 1.ファイル:各行の内容は、商品名、価格、数あります。 10. 3アップル 。テスラ1 100000 MAC 3000 2 レノボ3 30000。 鶏肉10 3 このデータ型に組み込まれるコード、スルー:[{ '名前': 'リンゴ'、 '価格':10、 '量':3}、 { '名前': 'テスラ' 、 '価格':1000000、 '量':1} ......] と合計金額を算出します。 2、次のドキュメント: ------- アレックス歳の少年パイソンスポンサー、創設者。 アレックスは、実際にサイモンです。 アレックスSBは誰ですか? あなたはまた、彼のシニア巨根ワイヤーの気質を隠すことができなかった、アレックス再びNiubi、非常に面白いです。 ---------- ファイルはすべて大文字アレックスSBに置き換えられます。