modified: zh-cn/csv.md

This commit is contained in:
AlightSoulmate 2025-04-01 21:39:23 +08:00
parent 56c7f6bb62
commit 2e437a7f27

View File

@ -1,16 +1,20 @@
--- ---
language: CSV language: CSV
contributors: contributors:
- [Timon Erhart, 'https://github.com/turbotimon/'] - [Timon Erhart, "https://github.com/turbotimon/"]
translators: translators:
- [Luca Yu, 'https://github.com/AlightSoulmate/'] - [Luca Yu, "https://github.com/AlightSoulmate/"]
--- ---
CSV逗号分隔值是一种轻量级纯文本表格数据格式其结构简单、可读性高,常用于程序间数据交换。 CSV逗号分隔值是一种轻量级纯文本表格数据格式十分适合表格与数据库传输,常用于程序间数据交换。
CSV 格式十分适合表格与数据库传输,能有效解决格式不兼容问题,使其成为跨平台数据互操作的“一等公民”。 它具有以下显著特点:
虽然 RFC 4180 提供了 CSV 格式的标准,但在实际应用中,"CSV" 这一术语通常被广义地用于指代任何符合以下条件的文本文件: - 结构简单
- 直观易读
- 跨系统兼容性强
"CSV" 这一术语可以指代任何符合以下条件的文本文件:
- 可被解析为表格数据 - 可被解析为表格数据
- 使用分隔符分隔字段(列) - 使用分隔符分隔字段(列)
@ -28,7 +32,7 @@ Charlie, 35, 1988-03-21
行:每行数据用换行符(`\n`或`\r\n`)分隔。 行:每行数据用换行符(`\n`或`\r\n`)分隔。
列:各字段常用特定分隔符(常用逗号隔开,只在某些地区(如德国用逗号表示小数)改用分号(`;`)。制表符(`\t`分隔的称为TSV制表符分隔值 列:各字段常用逗号隔开,只在某些地区(如德国用逗号表示小数)改用分号(`;`)。制表符(`\t`)分隔的称为 TSV制表符分隔值
示例:使用分号作为分隔符,并使用逗号表示小数点: 示例:使用分号作为分隔符,并使用逗号表示小数点:
@ -56,29 +60,31 @@ CSV 文件本身不定义数据类型。数字和日期均以纯文本存储。
## 字符串引用与特殊字符 ## 字符串引用与特殊字符
当字符串包含分隔符、特殊字符,或可能被误认为数字时,必须使用引号。通常建议始终加上引号,以提高文档可读性和健壮性。 只有当字符串包含分隔符、特殊字符,或可能被误认为数字时,才必须用引号进行引用。
不过建议始终给字符串加上引号,以提高可读性和健壮性。
```csv ```csv
示例: 示例:
1.未加引号的字符串, 1.未加引号的字符串,
2."建议加引号的字符串(良好实践)", 2."建议加引号的字符串(良好实践)",
3."如果包含分隔符,则必须加引号", 3."如果包含分隔符,则必须加引号",
4."如果包含特殊字符(如换行符 \n 或制表符 \t也必须加引号", 4."如果包含特殊字符(如换行符 \n 或制表符 \t也必须加引号",
5."引号字符本身通常通过双写引号("")来转义", 5."引号字符本身通常通过双写引号("")来转义",
6."某些系统则使用反斜杠来转义引号(例如:\")", 6."某些系统则使用反斜杠来转义引号(例如:\")",
``` ```
强烈建议同一份文档内的引用方式保持一致,例如,上方示例5、6分别用 `""``\"` 转义引号,混用将导致解析错误。 注意同一份文档内的引用方式保持一致,例如示例 5、6 分别用 `""``\"` 转义引号,混用将导致解析错误。
## 编码格式 ## 编码格式
CSV 文件可能使用不同的字符编码。现代大多使用 UTF-8 ,但旧系统可能仍然采用 ASCII 或 ISO-8859 等。 现代大多使用 UTF-8 编码格式,但旧系统可能仍然采用 ASCII 或 ISO-8859 等。
如果 CSV 文件需要在不同系统之间传输或共享,建议明确指定编码格式,以避免解析错误。 在不同系统之间传输或共享 CSV 文件时,建议明确指定编码格式,以避免解析错误。
最后如果你接触过爬虫或数据库一定熟悉CSV文件我建议你通过学习python等语言的csv文件操作来熟悉csv格式特性 最后,如果你接触过爬虫或数据库,一定熟悉 CSV 文件,我建议你通过学习 python 等语言的 csv 文件操作来熟悉 csv 格式特性!
## 更多资源 ## 更多资源
+ [维基百科](https://en.wikipedia.org/wiki/Comma-separated_values) - [维基百科](https://en.wikipedia.org/wiki/Comma-separated_values)
+ [RFC 4180](https://datatracker.ietf.org/doc/html/rfc4180) - [RFC 4180](https://datatracker.ietf.org/doc/html/rfc4180)