热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

网站流量数据采集环境部署及实现

一、原理分析与设计实现友情链接:https:www.cnblogs.comlikemebeep7967534.html二、系统环境部署!!

一、原理分析与设计实现

  

    友情链接:https://www.cnblogs.com/likemebee/p/7967534.html

 

 

 


二、系统环境部署

 

    !!!执行复制下列命令是注意查看是否为英文类型的 “-” ,当命令错误时首先排查该处

 

-------------------------------服务器  A  中部署开始-----------------------------------

  需要的安装包


uaJIT-2.0.4.tar.gz

set-misc-nginx-module-0.29.tar.gz
lua-nginx-module-0.10.0.tar.gz
ngx_devel_kit-0.2.19.tar.gz
echo-nginx-module-0.58.tar.gz

openresty-1.9.7.3.tar.gz

nginx-1.8.1.tar.gz

 


  • 服务器中安装依赖

yum -y install gcc perl pcre-devel openssl openssl-devel

 


  • 上传 LuaJIT-2.0.4.tar.gz 并安装 LuaJIT

tar -zxvf LuaJIT-2.0.4.tar.gz -C /usr/local/src/


cd /usr/local/src/LuaJIT-2.0.4/


make && make install PREFIX=/usr/local/luajit

 


  • 设置 LuaJIT 环境变量

vi /etc/profile


export LUAJIT_LIB=/usr/local/luajit/lib
export LUAJIT_INC
=/usr/local/luajit/include/luajit-2.0


source /etc/profile

 


  • 创建 modules 文件夹,保存 nginx 依赖的模块

mkdir -p /usr/local/nginx/modules

 


  • 上传 nginx 依赖的模块

set-misc-nginx-module-0.29.tar.gz
lua
-nginx-module-0.10.0.tar.gz
ngx_devel_kit
-0.2.19.tar.gz
echo
-nginx-module-0.58.tar.gz

 


  • 将依赖的模块直接解压到 modules 目录

tar -zxvf lua-nginx-module-0.10.0.tar.gz -C /usr/local/nginx/modules/
tar
-zxvf set-misc-nginx-module-0.29.tar.gz -C /usr/local/nginx/modules/
tar
-zxvf ngx_devel_kit-0.2.19.tar.gz -C /usr/local/nginx/modules/
tar
-zxvf echo-nginx-module-0.58.tar.gz -C /usr/local/nginx/modules/

 


  • 安装 openresty

tar -zxvf openresty-1.9.7.3.tar.gz -C /usr/local/src/


cd /usr/local/src/openresty-1.9.7.3/


./configure --prefix=/usr/local/openresty --with-luajit && make && make install

 


  • 安装 nginx

tar -zxvf nginx-1.8.1.tar.gz -C /usr/local/src/

 


  • 编译 nginx 并支持其他模块

1
cd /usr/local/src/nginx-1.8.1/


./configure --prefix=/usr/local/nginx \
--with-ld-opt="-Wl,-rpath,/usr/local/luajit/lib" \
--add-module=/usr/local/nginx/modules/ngx_devel_kit-0.2.19 \
--add-module=/usr/local/nginx/modules/lua-nginx-module-0.10.0 \
--add-module=/usr/local/nginx/modules/set-misc-nginx-module-0.29 \
--add-module=/usr/local/nginx/modules/echo-nginx-module-0.58


make -j2


make install

 

备注:如果对 linux 相关操作不熟,请严格按照上述步骤搭建环境,切记心细,心细,再心细。

 

-------------------------------服务器  A  中部署结束-----------------------------------

 


三、自定义采集数据实现

 

-------------------------------服务器  B  中执行开始-----------------------------------


  • 安装httpd

yum install httpd


  • 启动httpd

service httpd start


  • 进入/var/www/html/内上传 index.html页面文件

cd /var/www/html/

 


  • 创建页面 index.html

  页面 index.html代码如下:


DOCTYPE html>
<html><head><meta charset="UTF-8"><title>welcometitle> <script type="text/Javascript">var _maq = _maq || [];_maq.push([&#39;_setAccount&#39;, &#39;jiFeng&#39;]);(function() {var ma = document.createElement(&#39;script&#39;); ma.type = &#39;text/Javascript&#39;;ma.async = true;ma.src = &#39;http://192.168.175.153/ma.js&#39;;var s = document.getElementsByTagName(&#39;script&#39;)[0]; s.parentNode.insertBefore(ma, s);})();script>head><body><h1 align="center">云计算大数据h1> body>
html>


-------------------------------服务器  B  中执行结束-----------------------------------

-------------------------------服务器   A  中执行开始-----------------------------------


  •  在安装目录 nginx/html 下添加一个数据采集脚本 ma.js。

cd /usr/local/nginx/html/

 

      脚本 ma.js代码如下:


(function () {var params = {};//Document对象数据if(document) {params.domain = document.domain || &#39;&#39;; params.url = document.URL || &#39;&#39;; params.title = document.title || &#39;&#39;; params.referrer = document.referrer || &#39;&#39;; } //Window对象数据if(window && window.screen) {params.sh = window.screen.height || 0;params.sw = window.screen.width || 0;params.cd = window.screen.colorDepth || 0;} //navigator对象数据if(navigator) {params.lang = navigator.language || &#39;&#39;; } //解析_maq配置if(_maq) {for(var i in _maq) {switch(_maq[i][0]) {case &#39;_setAccount&#39;:params.account = _maq[i][1];break;default:break;} } } //拼接参数串var args = &#39;&#39;; for(var i in params) {if(args != &#39;&#39;) {args += &#39;&&#39;;} args += i + &#39;=&#39; + encodeURIComponent(params[i]);} //通过Image对象请求后端脚本var img = new Image(1, 1); img.src = &#39;http://192.168.175.153/log.gif?&#39; + args;
})();


 


  •  修改 nginx 的配置文件,添加自定义相关业务逻辑。

cd /usr/local/nginx/conf


vi nginx.conf


worker_processes 2;events {worker_connections 1024;
}http {include mime.types;default_type application/octet-stream;log_format main &#39;$remote_addr - $remote_user [$time_local] "$request" &#39;&#39;$status $body_bytes_sent "$http_referer" &#39;&#39;"$http_user_agent" "$http_x_forwarded_for"&#39;;log_format user_log_format "$msec||$remote_addr||$status||$body_bytes_sent||$u_domain||$u_url||$u_title||$u_referrer||$u_sh||$u_sw||$u_cd||$u_lang||$http_user_agent||$u_account";sendfile on; #允许sendfile方式传输文件,默认为offkeepalive_timeout 65; #连接超时时间,默认为75sserver {listen 80;server_name localhost;location /log.gif {#伪装成gif文件default_type image/gif; #nginx本身记录的access_log,日志格式为mainaccess_log logs/access.log main;access_by_lua "-- 用户跟踪COOKIE名为__utracelocal uid = ngx.var.COOKIE___utrace if not uid then-- 如果没有则生成一个跟踪COOKIE,算法为md5(时间戳+IP+客户端信息)uid = ngx.md5(ngx.now() .. ngx.var.remote_addr .. ngx.var.http_user_agent)end ngx.header[&#39;Set-COOKIE&#39;] = {&#39;__utrace=&#39; .. uid .. &#39;; path=/&#39;}if ngx.var.arg_domain then-- 通过subrequest到/i-log记录日志,将参数和用户跟踪COOKIE带过去ngx.location.capture(&#39;/i-log?&#39; .. ngx.var.args .. &#39;
&utrace=&#39; .. uid)end "; #此请求资源本地不缓存add_header Expires "Fri, 01 Jan 1980 00:00:00 GMT";add_header Pragma "no-cache";add_header Cache-Control "no-cache, max-age=0, must-revalidate";#返回一个1×1的空gif图片empty_gif;} location /i-log {#内部location,不允许外部直接访问internal;#设置变量,注意需要unescapeset_unescape_uri $u_domain $arg_domain;set_unescape_uri $u_url $arg_url;set_unescape_uri $u_title $arg_title;set_unescape_uri $u_referrer $arg_referrer;set_unescape_uri $u_sh $arg_sh;set_unescape_uri $u_sw $arg_sw;set_unescape_uri $u_cd $arg_cd;set_unescape_uri $u_lang $arg_lang;set_unescape_uri $u_account $arg_account;#打开subrequest(子请求)日志log_subrequest on;#自定义采集的日志,记录数据到user_defined.logaccess_log logs/user_defined.log user_log_format;#输出空字符串echo &#39;&#39;;} }
}


 


  •  启动 nginx

cd /usr/local/nginx


sbin/nginx -c conf/nginx.conf


  •  查看是否启动

ps -ef | grep nginx

 

  

-------------------------------服务器   A  中执行结束-----------------------------------


  •  通过游览器访问 nginx

访问:192.168.175.151/index.html

 -------------------------------服务器   A  中执行开始-----------------------------------


  • 观察自定义日志采集文件是否有对应的内容输出:

cd /usr/local/nginx/logs


tail -f user_defined.log

 

 

此时还可以观察 nginx 默认的输出日志文件:


tail -f access.log

 

停止 nginx: 


cd /usr/local/nginx


sbin/nginx –s stop

-------------------------------服务器   A  中执行结束-----------------------------------


推荐阅读
  • 本文介绍了如何在Linux系统中获取库源码,并在从源代码编译软件时收集所需的依赖项列表。 ... [详细]
  • 在Ubuntu 18.04上使用Nginx搭建RTMP流媒体服务器
    本文详细介绍了如何在Ubuntu 18.04上使用Nginx和nginx-rtmp-module模块搭建RTMP流媒体服务器,包括环境搭建、配置文件修改和推流拉流操作。适用于需要搭建流媒体服务器的技术人员。 ... [详细]
  • centos 7.0 lnmp成功安装过程(很乱)
    下载nginx[rootlocalhostsrc]#wgethttp:nginx.orgdownloadnginx-1.7.9.tar.gz--2015-01-2412:55:2 ... [详细]
  • 用阿里云的免费 SSL 证书让网站从 HTTP 换成 HTTPS
    HTTP协议是不加密传输数据的,也就是用户跟你的网站之间传递数据有可能在途中被截获,破解传递的真实内容,所以使用不加密的HTTP的网站是不 ... [详细]
  • 本指南详细介绍了如何利用华为云对象存储服务构建视频点播(VoD)平台。通过结合开源技术如Ceph、WordPress、PHP和Nginx,用户可以高效地实现数据存储、内容管理和网站搭建。主要内容涵盖华为云对象存储系统的配置步骤、性能优化及安全设置,为开发者提供全面的技术支持。 ... [详细]
  • 在使用 Nginx 作为服务器时,发现 Chrome 能正确从缓存中读取 CSS 和 JS 文件,而 Firefox 却无法有效利用缓存,导致加载速度显著变慢。 ... [详细]
  • 利用 Calcurse 在 Linux 终端高效管理日程与任务
    对于喜爱使用 Linux 终端进行日常操作的系统管理员来说,Calcurse 提供了一种强大的方式来管理日程安排、待办事项及会议。本文将详细介绍如何在 Linux 上安装和使用 Calcurse,帮助用户更有效地组织工作。 ... [详细]
  • 本文探讨了在Windows系统中运行Apache服务器时频繁出现崩溃的问题,并提供了多种可能的解决方案和建议。错误日志显示多个子进程因达到最大请求限制而退出。 ... [详细]
  • 本文详细探讨了在Web开发中常见的UTF-8编码问题及其解决方案,包括HTML页面、PHP脚本、MySQL数据库以及JavaScript和Flash应用中的乱码问题。 ... [详细]
  • 电商高并发解决方案详解
    本文以京东为例,详细探讨了电商中常见的高并发解决方案,包括多级缓存和Nginx限流技术,旨在帮助读者更好地理解和应用这些技术。 ... [详细]
  • 本文将详细探讨PHP中C的作用,并对比其他编程语言如Java和C的特点及其适用场景。 ... [详细]
  • 网站访问全流程解析
    本文详细介绍了从用户在浏览器中输入一个域名(如www.yy.com)到页面完全展示的整个过程,包括DNS解析、TCP连接、请求响应等多个步骤。 ... [详细]
  • 大家好,我是李白。本文将分享一个从零开始的全栈项目,涵盖了设计、前端、后端和服务端的全面学习过程。通过这个项目,我希望能够帮助初学者更好地理解和掌握全栈开发的技术栈。 ... [详细]
  • 服务器部署中的安全策略实践与优化
    服务器部署中的安全策略实践与优化 ... [详细]
  • 为了确保iOS应用能够安全地访问网站数据,本文介绍了如何在Nginx服务器上轻松配置CertBot以实现SSL证书的自动化管理。通过这一过程,可以确保应用始终使用HTTPS协议,从而提升数据传输的安全性和可靠性。文章详细阐述了配置步骤和常见问题的解决方法,帮助读者快速上手并成功部署SSL证书。 ... [详细]
author-avatar
游走的小张
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有