命令行模式下的chrome浏览器
【Headless Chrome】
在 Chrome 59 中开始搭载 Headless Chrome。这是一种在无需显示headless的环境下运行 Chrome 浏览器的方式,简单说就是在命令行运行浏览器。
【安装Chrome】
centos 6下无法支持,安装centos 7系统,运行如下命令
curl https://intoli.com/install-google-chrome.sh | bash
【安装中文字体】
如果你想分析中文网页还需要安装中文字体
yum -y install fontconfig
到windows目录下的font目录找一个字体文件,比如黑体:simhei.ttf
服务器新建/usr/shared/fonts/chinese目录,上传字体文件到这里
chmod -R 755 /usr/share/fonts/chinese
yum -y install ttmkfdir
ttmkfdir -e/usr/share/X11/fonts/encodings/encodings.dir
编辑v/etc/fonts/fonts.conf
增加
刷新内存中的字体缓存,这样就不用reboot重启了:
fc-cache
【使用】
1、保存页面为图片
比如访问百度页面并保存为图片
google-chrome-stable --no-sandbox --headless --disable-gpu --screenshot https://www.baidu.com
2、获取页面内容
--dump-dom参数打印document.body.innerHTML的内容
google-chrome-stable --no-sandbox --headless --disable-gpu --dump-dom https://www.baidu.com/
参考:
12
12
发表评论