欢迎加入QQ讨论群258996829
麦子学院 头像
苹果6袋
6
麦子学院

用Python多线程实现生产者消费者模式

发布时间:2017-04-17 10:16  回复:0  查看:2445   最后回复:2017-04-17 10:16  
本文和大家分享的主要是使用 python多线程实现生产者消费者模式相关内容,一起来看看吧,希望对大家学习和使用这部分内容有所帮助。
   什么是生产者消费者模式
  在软件开发的过程中,经常碰到这样的场景:
  某些模块负责生产数据,这些数据由其他模块来负责处理(此处的模块可能是:函数、线程、进程等)。产生数据的模块称为生产者,而处理数据的模块称为消费者。在生产者与消费者之间的缓冲区称之为仓库。生产者负责往仓库运输商品,而消费者负责从仓库里取出商品,这就构成了生产者消费者模式。
   结构图如下:
用Python多线程实现生产者消费者模式
  为了大家容易理解,我们举一个寄信的例子。假设你要寄一封信,大致过程如下:
  1 、你把信写好 —— 相当于生产者生产数据
  2 、你把信放入邮箱 —— 相当于生产者把数据放入缓冲区
  3 、邮递员把信从邮箱取出,做相应处理 —— 相当于消费者把数据取出缓冲区,处理数据
   生产者消费者模式的优点
  · 解耦
  假设生产者和消费者分别是两个线程。如果让生产者直接调用消费者的某个方法,那么生产者对于消费者就会产生依赖(也就是耦合)。如果未来消费者的代码发生变化,可能会影响到生产者的代码。而如果两者都依赖于某个缓冲区,两者之间不直接依赖,耦合也就相应降低了。
  举个例子,我们去邮局投递信件,如果不使用邮箱(也就是缓冲区),你必须得把信直接交给邮递员。有同学会说,直接给邮递员不是挺简单的嘛?其实不简单,你必须  得认识谁是邮递员,才能把信给他。这就产生了你和邮递员之间的依赖(相当于生产者和消费者的强耦合)。万一哪天邮递员  换人了,你还要重新认识一下(相当于消费者变化导致修改生产者代码)。而邮箱相对来说比较固定,你依赖它的成本就比较低(相当于和缓冲区之间的弱耦合)。
  · 并发
  由于生产者与消费者是两个独立的并发体,他们之间是用缓冲区通信的,生产者只需要往缓冲区里丢数据,就可以继续生产下一个数据,而消费者只需要从缓冲区拿数据即可,这样就不会因为彼此的处理速度而发生阻塞。
  继续上面的例子,如果我们不使用邮箱,就得在邮局等邮递员,直到他回来,把信件交给他,这期间我们啥事儿都不能干(也就是生产者阻塞)。或者邮递员得挨家挨户问,谁要寄信(相当于消费者轮询)。
  · 支持忙闲不均
  当生产者制造数据快的时候,消费者来不及处理,未处理的数据可以暂时存在缓冲区中,慢慢处理掉。而不至于因为消费者的性能造成数据丢失或影响生产者生产。
  ·
  我们再拿寄信的例子,假设邮递员一次只能带走1000 封信,万一碰上情人节(或是圣诞节)送贺卡,需要寄出去的信超过了 1000 封,这时候邮箱这个缓冲区就派上用场了。邮递员把来不及带走的信暂存在邮箱中,等下次过来时再拿走。
  通过上面的介绍大家应该已经明白了生产者消费者模式。
  Python 中的多线程编程
  在实现生产者消费者模式之前,我们先学习下Python 中的多线程编程。
  线程是操作系统直接支持的执行单元,高级语言通常都内置多线程的支持,Python 也不例外,并且 Python 的线程是真正的 Posix Thread ,而不是模拟出来的线程。
  Python 的标准库提供了两个模块: _thread threading _thread 是低级模块, threading 是高级模块,对 _thread 进行了封装。绝大多数情况下,我们只需要使用 threading 这个高级模块。
  下面我们先看一段在Python 中实现多线程的代码。
  importtime,threading# 线程代码class TaskThread(threading.Thread):
  def__init__(self,name):
  threading.Thread.__init__(self,name=name)
  defrun(self):
  print('thread %s is running...' % self.getName())
  for i in range(6):
  print('thread %s >>> %s' % (self.getName(), i))
  time.sleep(1)
  print('thread %s finished.' % self.getName())
  taskthread = TaskThread('TaskThread')
  taskthread.start()
  taskthread.join()
  下面是程序的执行结果:
  threadTaskThreadis running...
  threadTaskThread >>> 0
  threadTaskThread >>> 1
  threadTaskThread >>> 2
  threadTaskThread >>> 3
  threadTaskThread >>> 4
  threadTaskThread >>> 5
  threadTaskThreadfinished.
  TaskThread 类继承自 threading 模块中的 Thread 线程类。构造函数的 name 参数指定线程的名字,通过重载基类 run 函数实现具体任务。
  在简单熟悉了Python 的线程后,下面我们实现一个生产者消费者模 shi
  fromQueueimportQueue
  importrandom,threading,time
  # 生产者类class Producer(threading.Thread):
  def__init__(self, name,queue):
  threading.Thread.__init__(self, name=name)
  self.data=queue
  defrun(self):
  for i in range(5):
  print("%s is producing %d to the queue!" % (self.getName(), i))
  self.data.put(i)
  time.sleep(random.randrange(10)/5)
  print("%s finished!" % self.getName())
  # 消费者类class Consumer(threading.Thread):
  def__init__(self,name,queue):
  threading.Thread.__init__(self,name=name)
  self.data=queue
  defrun(self):
  for i in range(5):
  val = self.data.get()
  print("%s is consuming. %d in the queue is consumed!" % (self.getName(),val))
  time.sleep(random.randrange(10))
  print("%s finished!" % self.getName())
  defmain():
  queue = Queue()
  producer = Producer('Producer',queue)
  consumer = Consumer('Consumer',queue)
  producer.start()
  consumer.start()
  producer.join()
  consumer.join()
  print 'All threads finished!'
  if __name__ == '__main__':
  main()
  执行结果可能如下:
  Produceris producing 0 to thequeue!
  Consumeris consuming. 0 in thequeueis consumed!
  Produceris producing 1 to thequeue!
  Produceris producing 2 to thequeue!
  Consumeris consuming. 1 in thequeueis consumed!
  Consumeris consuming. 2 in thequeueis consumed!
  Produceris producing 3 to thequeue!
  Produceris producing 4 to thequeue!
  Producerfinished!
  Consumeris consuming. 3 in thequeueis consumed!
  Consumeris consuming. 4 in thequeueis consumed!
  Consumerfinished!
  Allthreadsfinished!
  因为多线程是抢占式执行的,所以打印出的运行结果不一定和上面的完全一致。
   小结
  本例通过Python 实现了一个简单的生产者消费者模型。 Python 中的 Queue 模块已经提供了对线程同步的支持,所以本文并没有涉及锁、同步、死锁等多线程问题。
您还未登录,请先登录

热门帖子

最新帖子