因此,我正在研究如何跨多个进程运行socket.io。
导游:https://socket.io/docs/using-multiple-nodes/给我留下了一些问题。
它提到使用配置nginx来实现socket.io进程之间的负载平衡,但也提到了在下面的Node.js中使用内置集群模块。
为此,我应该使用Node.js中的nginx和集群模块吗?
另外,如何判断负载平衡是否有效?
我使用nginx选项测试了它,使用redis适配器和集群模块运行了两个socket.io进程。
这就是我在nginx配置中拥有的内容:
http {
upstream io_nodes {
ip_hash;
server 127.0.0.1:6001;
server 127.0.0.1:6002;
}
server {
listen 3000;
server_name example.com;
location / {
proxy_set_header Upgrade $http_upgrade;
proxy_set_header Connection "upgrade";
proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
proxy_set_header Host $host;
proxy_http_version 1.1;
proxy_pass http://io_nodes;
}
}这是我的socket.io代码的一个示例(大部分代码摘自这里:https://github.com/elad/node-cluster-socket.io):
var express = require('express'),
cluster = require('cluster'),
net = require('net'),
redis = require('redis'),
sio = require('socket.io'),
sio_redis = require('socket.io-redis');
var port = 6001,
num_processes = require('os').cpus().length;
if (cluster.isMaster) {
console.log('is master 6001');
// This stores our workers. We need to keep them to be able to reference
// them based on source IP address. It's also useful for auto-restart,
// for example.
var workers = [];
// Helper function for spawning worker at index 'i'.
var spawn = function(i) {
workers[i] = cluster.fork();
// Optional: Restart worker on exit
workers[i].on('exit', function(code, signal) {
console.log('respawning worker', i);
spawn(i);
});
};
// Spawn workers.
for (var i = 0; i < num_processes; i++) {
spawn(i);
}
// Helper function for getting a worker index based on IP address.
// This is a hot path so it should be really fast. The way it works
// is by converting the IP address to a number by removing non numeric
// characters, then compressing it to the number of slots we have.
//
// Compared against "real" hashing (from the sticky-session code) and
// "real" IP number conversion, this function is on par in terms of
// worker index distribution only much faster.
var worker_index = function(ip, len) {
var s = '';
for (var i = 0, _len = ip.length; i < _len; i++) {
if (!isNaN(ip[i])) {
s += ip[i];
}
}
return Number(s) % len;
};
// Create the outside facing server listening on our port.
var server = net.createServer({ pauseOnConnect: true }, function(connection) {
// We received a connection and need to pass it to the appropriate
// worker. Get the worker for this connection's source IP and pass
// it the connection.
var worker = workers[worker_index(connection.remoteAddress, num_processes)];
worker.send('sticky-session:connection', connection);
}).listen(port);
} else {
// Note we don't use a port here because the master listens on it for us.
var app = new express();
// Here you might use middleware, attach routes, etc.
// Don't expose our internal server to the outside.
var server = app.listen(0, 'localhost'),
io = sio(server);
// Tell Socket.IO to use the redis adapter. By default, the redis
// server is assumed to be on localhost:6379. You don't have to
// specify them explicitly unless you want to change them.
io.adapter(sio_redis({ host: 'localhost', port: 6379 }));
// Here you might use Socket.IO middleware for authorization etc.
io.on('connection', function(socket) {
console.log('port 6001');
console.log(socket.id);
});
// Listen to messages sent from the master. Ignore everything else.
process.on('message', function(message, connection) {
if (message !== 'sticky-session:connection') {
return;
}
// Emulate a connection event on the server by emitting the
// event with the connection the master sent us.
server.emit('connection', connection);
connection.resume();
});
}虽然我正在本地测试所有的连接,但是这种连接工作得很好。
我怎么知道它是否正常工作?每次客户端连接时,它似乎都连接到端口6001上的6001进程。
客户端连接代码连接到端口3000。
发布于 2017-08-08 02:05:25
为此,我应该使用Node.js中的nginx和集群模块吗?
如果所有服务器进程都在一台计算机上,则可以不使用NGINX而使用群集模块。
如果您使用的是多台服务器计算机,那么您需要像NGINX这样的网络基础结构来在不同的服务器之间负载平衡,因为node.js集群不能为您做到这一点。
而且,您可以同时使用这两种方式(多台服务器负载由NGINX之类的负载平衡,以及在每台服务器上运行集群的每台服务器)。这里的关键是node.js集群只在同一主机上的不同进程之间传播负载。
另外,如何判断负载平衡是否有效?
您可以让每个进程日志记录它正在处理的活动,并添加进程ID作为日志记录的一部分,如果同时加载多个请求,则应该会看到每个进程正在处理一些负载。如果您进行了实际的负载测试,那么在进行集群和不使用集群的情况下,您应该可以获得更大的吞吐量。请记住,总吞吐量取决于瓶颈所在,因此,如果您的服务器实际上是数据库绑定的,并且所有集群进程都使用相同的数据库,那么您可能不会从集群node.js流程中获益多少。另一方面,如果您的node.js过程是计算密集型的,并且您的服务器中有多个核,那么您可以从集群中获得显著的好处。
发布于 2017-09-05 15:30:58
向上面的解决方案添加更多的点。
另外,如何判断负载平衡是否有效?
我使用的是节点-调试作为相同,它打开多个调试器作为每个线程数。现在您可以添加断点来检查负载是否被正确分配。
https://stackoverflow.com/questions/45536343
复制相似问题