kafka的使用—系统保卫战

前言

最近有个需求，在不同的系统中做数据同步。我们是java+mysql、他们是c#+sqlserver。需求是sqlserver提出的，并且他们提出要实时，并且要我们主动推数据给他们。他们接口都提供好了，说要我们对数据库表操作的时候调用他们的接口把数据传他们。咋看没有什么事，不就是一个接口的调用么。仔细想想，这样对我们的系统影响还是很大的，其他的不说。重要的一点是我们的系统都依赖他们的系统了，如果他们的系统问题或网络问题会影响我们系统的操作，这显然是不可行的。为了保卫我们系统的利益。这种事是绝对不能做的。

讨论了一下了解到，他们的需求无非就是需要实时能得到某个表的数据码。刚开始我提出，我们开一个接口，让你们查看我们从库数据不就好了，这样多省事。可是他们说自己要保存数据到sqlserver(当然还有其他原因)。他们要把事情搞复杂也没办法。当然，我们同样要保护自己的利益啊。这时候就想到了使用 MQ 消息队列的方案。我们只要在数据操作成功后吧数据传到 MQ 中，之后的处理就让他们自己做了。真的是费了好大的力气才说服让他们使用 MQ 啊~~~

下面就使用python来模拟一下我们的方案（希望大家来吐槽 :) ）

软件介绍

在这里我们使用 zookeeper + kafka 的方案来做。

软件	版本	其他
zookeeper	3.4.6
kafka	2.10-0.9.0.0
pykafka	2.1.2	python的kafka API

zookeeper + kafka 基本使用教程

http://www.linuxidc.com/Linux/2014-07/104470.htm

先决条件

使用zookeeper、kafka创建一个topic名为 goods-topic
需要安装pykafka一个python的zookeeper、kafka API
一个goods示例数据库

使用消息队列:

# 启动zookeeper
/usr/local/zookeeper/bin/zkServer.sh start
# 启动kafka
/usr/local/kafka/bin/kafka-server-start.sh /usr/local/kafka/config/server.properties > /tmp/kafka-logs/kafka.out 2>&1 &
# 创建 goods-topic
/usr/local/kafka/bin/kafka-topics.sh \
  --create \
  --zookeeper localhost:2181 \
  --replication-factor 1 \
  --partitions 1 \
  --topic test

安装pykafka:

pip install pykafka

官网：http://readthedocs.org/projects/pykafka/

创建示例数据库:

CREATE TABLE goods(
  goods_id INT NOT NULL AUTO_INCREMENT,
  goods_name VARCHAR(30) NOT NULL,
  goods_price DECIMAL(13, 2) NOT NULL DEFAULT 0.00,
  create_time DATETIME NOT NULL,
  PRIMARY KEY(goods_id)
);

伪代码展示

生产者端伪代码-python

import time, json
from pykafka import KafkaClient
 
# 相关的mysql操作
mysql_op()
 
# 可接受多个Client这是重点
client = KafkaClient(hosts="192.168.1.233:9092, \
                            192.168.1.233:9093, \
                            192.168.1.233:9094")
# 选择一个topic
topic = client.topics['goods-topic']
# 创建一个生产者
producer = topic.get_producer()
# 模拟接收前端生成的商品信息
goods_dict = {
  'option_type':'insert'
  'option_obj':{
    'goods_name':'goods-1',
    'goods_price':10.00,
    'create_time':time.strftime('%Y-%m-%d %H:%M:%S')
  }
}
goods_json = json.dumps(goods_dict)
# 生产消息
producer.produce(msg)

消费者端伪代码-python(作为后台进程在跑)

import time, json
from pykafka import KafkaClient
# 可接受多个Client这是重点
client = KafkaClient(hosts="192.168.1.233:9092, \
                            192.168.1.233:9093, \
                            192.168.1.233:9094")
# 选择一个topic
topic = client.topics['goods-topic']
# 生成一个消费者
balanced_consumer = topic.get_balanced_consumer(
  consumer_group='goods_group',
  auto_commit_enable=True,
  zookeeper_connect='localhost:2181'
)
# 消费信息
for message in balanced_consumer:
  if message is not None:
    # 解析json为dict
    goods_dict = json.loads(message)
    # 对数据库进行操作
    if goods_dict['option_type'] == 'insert':
      mysql_insert()
    elif goods_dict['option_type'] == 'update':
      mysql_update()
    elif goods_dict['option_type'] == 'delete':
      mysql_delete()
    else:
      order_option()

作者信息

昵称：HH

QQ：275258836

感觉本文内容不错，读后有收获？

逛逛衣服店，鼓励作者写出更好文章。

本文由主机测评网发布，不代表主机测评网立场，转载联系作者并注明出处：https://zhuji.jb51.net/yunwei/8081.html