dxc4444 发表于 2024-1-10 14:31:15

抛砖引玉个无聊的东西,搜索数字在圆周率前10亿位的位置

wget https://zxd.coding.net/p/pi/d/pi/git/raw/master/pi.tar.gz

tar zxvf pi.tar.gz

得到pi.txt

wget https://zxd.coding.net/p/pi/d/pi/git/raw/master/pi.php

把pi.txt和上面这个php文件放一起,参数就一个s,s是需要查询的数字

不怎么懂代码,所以写的很烂,但是能用

目前主要有这样的问题,这个txt大概950m,并且都在一行里面,php检索起来很慢

用我那个代码的话,遍历大概要5秒钟,但是不怎么耗内存

有没有大佬能优化下,通过数据库或者什么算法,让搜索更快点

还有就是有没有办法和公众号配合,实现在公众号里面查询

灌水王 发表于 2024-1-10 14:31:28

可以试试用4个数字来建索引:
0000 => 所有0000开头的数字位置
0001 => 所有0001开头的数字位置
...
9999 => 所有9999开头的数字位置

也可以试试用3个或5个数字建索引,比较下哪种方式更节省CPU和内存。

灌水王 发表于 2024-1-10 14:31:50

1. 读入内存长驻
2. 自己用C写搜索,算法课本里有的
3. 进程间通讯https://cdn.jsdelivr.net/gh/master-of-forums/master-of-forums/public/images/patch.gif

灌水王 发表于 2024-1-10 14:32:22

C语言字符串搜索函数自带kmp等高效算法吧,不用自己实现。

感觉楼主并不想把900多M一起读入内存。

灌水王 发表于 2024-1-10 14:32:41

道理上确实是的,不过实际使用中,c的字符串搜索,比如strstr并不高效,映象中有替代的string库更高效一些。自己按照算法写,最好是内嵌汇编来得最快。这个我以前做项目时遇到过。
楼主是用纯php写,这个肯定不能读进内存了,每次读文件,效率肯定不行的。用数据库等辅助另议。
因为楼主标题也说了是无聊讨论算法嘛,所以我按照最高效的方法来说了,没局限在他的那个php代码了。https://cdn.jsdelivr.net/gh/master-of-forums/master-of-forums/public/images/patch.gif

灌水王 发表于 2024-1-10 14:32:57

3.1415926.xyz   路过



/**
* MJJ命运啊,说是注定,不如说是你忘了是在何时做了选择。——《塔希里亚故事集》
*
* 森林鸟 forestbird Link https://bird.work
*/

灌水王 发表于 2024-1-10 14:33:23

破刀 发表于 2022-2-21 08:53
3.1415926.xyz   路过



300CNY收了一个3.1415926.xyz

+1

灌水王 发表于 2024-1-10 14:34:10

好域名
页: [1]
查看完整版本: 抛砖引玉个无聊的东西,搜索数字在圆周率前10亿位的位置