火车采集 中文字正则表达式

[复制链接]
查看: 8711   回复: 5
发表于 2024-6-19 17:33:28 | 显示全部楼层 |阅读模式
用火车采集
提取中文字(包括简体 繁体)正则表达式,到底怎么写啊?

<h1>(?<content>[\u4e00-\u9fa5])</h1>
<h1>(?<content>[\u4e00-\u9fa5]*)</h1>
<h1>(?<content>[^\x00-\xff])</h1>


都试过,提取都为空。。。


求大佬给个公式
回复

使用道具 举报

发表于 2024-6-19 17:33:34 | 显示全部楼层
[u4E00-u9F5a]
回复 支持 反对

使用道具 举报

发表于 2024-6-19 17:33:54 | 显示全部楼层
试过的啊,为空,提不出来。。。
回复 支持 反对

使用道具 举报

 楼主| 发表于 2024-6-19 17:34:33 | 显示全部楼层
igoogle 发表于 2022-4-9 14:32
试过的啊,为空,提不出来。。。
给你个思路,应该要先把待提取的内容转换编码,然后用正则提取,提取到以后再转换回汉字
回复 支持 反对

使用道具 举报

发表于 2024-6-19 17:35:31 | 显示全部楼层
转换编码之后,怎么提取啊。。。
回复 支持 反对

使用道具 举报

 楼主| 发表于 2024-6-19 17:36:23 | 显示全部楼层
求大佬教教我
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则