JavaRush /Blog Java /Random-MS /Bait. Apa yang kita baca dari fail?
Roman
Tahap

Bait. Apa yang kita baca dari fail?

Diterbitkan dalam kumpulan
Secara umum, ini adalah maklumat untuk pemula. Apabila topik membaca maklumat dari fail muncul, persoalan timbul: jika fail itu mengandungi huruf, maka mengapa kita membaca nombor daripadanya dalam bentuk bait dan apakah bait dalam kes ini? Apa itu bait telah pun ditulis dengan baik di sini. Tetapi, selepas membaca, persoalan mekanisme untuk mengubah huruf menjadi nombor masih kekal, jadi saya terpaksa menggali sedikit lebih mendalam di Internet. Oleh itu, apa yang ditulis di bawah boleh dianggap sebagai tambahan. Komputer menyimpan setiap fail sebagai maklumat yang terdiri daripada sifar dan satu dalam bentuk binari. Setiap fail sebenarnya adalah koleksi bait yang mengikuti satu sama lain. Biasanya, terdapat dua jenis fail maklumat: fail teks dan fail binari. Fail teks mengandungi set biasa manusia aksara yang boleh dibaca, yang boleh kami buka dalam mana-mana editor teks. Fail binari terdiri daripada aksara yang kita tidak biasa beroperasi dalam kehidupan seharian; oleh itu, program khas diperlukan yang boleh membacanya. Fail teks terdiri daripada huruf, nombor dan aksara biasa yang lain. Fail sedemikian mempunyai sambungan .txt, .py, .csv, dsb. Apabila kami membuka fail sedemikian, kami melihat set aksara biasa yang membentuk perkataan. Walaupun pada hakikatnya kandungan ini tidak disimpan dalam bentuk ini di dalam komputer. Ia disimpan dalam bentuk bit, iaitu 0 atau 1. Dalam pelbagai jadual pengekodan ASCII, UNICODE atau beberapa nilai lain bagi setiap aksara ditakrifkan dalam bentuk binari. Sehubungan itu, jika satu bait boleh memuatkan 256 aksara, maka setiap aksara mempunyai pengekodan binari sendiri bagi sifar dan satu (lapan sifar ditulis berturut-turut atau satu aksara memberikan satu aksara). Oleh itu, apabila fail dibuka, editor teks menterjemah setiap nilai ASCII ke dalam aksara biasa dan memaparkannya dalam bentuk biasa. Sebagai contoh, pada nombor 65 dalam bentuk binari kod ASCII ialah 1000001, yang akan dipaparkan dalam fail dengan huruf Latin (bukan abjad Cyrillic. Abjad Cyrillic bermula dari kedudukan 192) huruf "A". Iaitu, dalam sistem ASCII, bait dengan nilai 1000001 sepadan dengan nilai huruf Latin "A". Setiap baris fail mempunyai pemisah barisnya sendiri - EOL (End of Line). Selalunya aksara ini (dua aksara) ialah "\n" (nilai binari dalam ASCII: 00001010). Setelah membaca watak sedemikian, program mentafsirkannya sebagai penghujung baris dan peralihan ke baris di bawah. Terdapat "simbol berfungsi" lain yang serupa. Fail binari, seperti fail teks, disimpan dalam bentuk binari, tetapi ia tidak "dilekatkan" pada program yang menyahkodnya, iaitu, tiada jadual penyahsulitan jenis ASCII. Pada asasnya, kandungan fail tersebut ialah gambar, audio dan video, yang seterusnya merupakan versi termampat bagi fail lain, seperti fail laksana sendiri (.exe). Fail sedemikian (binari) tidak boleh dibaca oleh manusia dalam erti kata biasa, jadi percubaan untuk membukanya dengan editor teks konvensional akan memaparkan sekumpulan sampah yang tidak dapat difahami. Sehubungan itu, program khas dihasilkan untuk membaca fail tersebut dengan betul. Fail binari juga disimpan sebagai satu siri bait, tetapi dalam kes ini, menukar walaupun satu bit boleh menjadikan keseluruhan fail tidak boleh dibaca. Jadual aksara ASCII boleh dilihat di sini. Oleh itu, apabila kita membaca fail, 8 aksara (satu atau sifar) dibaca ke dalam pembolehubah bait, yang kemudiannya boleh ditukar oleh beberapa program seperti Notepad kepada aksara yang boleh dibaca. Sumber yang membantu saya memahaminya.
Komen
TO VIEW ALL COMMENTS OR TO MAKE A COMMENT,
GO TO FULL VERSION