灌水王 发表于 2024-6-19 17:33:28

火车采集 中文字正则表达式

用火车采集
提取中文字(包括简体 繁体)正则表达式,到底怎么写啊?

<h1>(?<content>[\u4e00-\u9fa5])</h1>
<h1>(?<content>[\u4e00-\u9fa5]*)</h1>
<h1>(?<content>[^\x00-\xff])</h1>


都试过,提取都为空。。。


求大佬给个公式

wszwy 发表于 2024-6-19 17:33:34

Xdsbspujsiqh 发表于 2024-6-19 17:33:54

试过的啊,为空,提不出来。。。

灌水王 发表于 2024-6-19 17:34:33

igoogle 发表于 2022-4-9 14:32
试过的啊,为空,提不出来。。。
给你个思路,应该要先把待提取的内容转换编码,然后用正则提取,提取到以后再转换回汉字

heirainy 发表于 2024-6-19 17:35:31

转换编码之后,怎么提取啊。。。

灌水王 发表于 2024-6-19 17:36:23

求大佬教教我
页: [1]
查看完整版本: 火车采集 中文字正则表达式