Scala 2.10.X 的 actor 与Java 多线程对比,及使用 actor 多线程完成wordcount 思路及实例代码

目录

  • 1.scala 中处理多线程解决方案
  • 2.scala 与 java 在多线程对比
  • 3.scala actor 多线程完成 wordcount 程序

1.scala 中处理多线程解决方案

scala 2.10.x 之前使用 actor;

scala 2.11 之后使用 akka;

Scala中的Actor能够实现并行编程的强大功能,它是基于事件模型的并发机制;

Scala是运用消息的发送、接收来实现多线程的,使用Scala能够更容易地实现多线程应用的开发。

scala 执行顺序:

  • 首先调用start()方法启动Actor
  • 调用start()方法后其act()方法会被执行
  • 向Actor发送消息

发送消息的方式:

!

发送异步消息,没有返回值。

!?

发送同步消息,等待返回值。

!!

发送异步消息,返回值是 Future[Any]。

2.scala 与 java 在多线程对比

在Java中,它的多线程实现需要对共享资源(变量、对象等)使用synchronized 关键字进行代码块同步、对象锁互斥等。而且,常常一大块的try…catch语句块中加上wait方法、notify方法、notifyAll方法是让人很头疼的。原因就在于Java中多数使用的是可变状态的对象资源,对这些资源进行共享来实现多线程编程的话,控制好资源竞争与防止对象状态被意外修改是非常重要的,而对象状态的不变性也是较难以保证的。

在Scala中,我们可以通过复制不可变状态的资源(即对象,Scala中一切都是对象,连函数、方法也是)的一个副本,再基于Actor的消息发送、接收机制进行并行编程。

3.scala actor 多线程完成 wordcount 程序

需求: 用actor并发编程写一个单机版的WorldCount,将多个文件(c盘下多个文件)作为输入,计算完成后将多个任务汇总,得到最终的结果。

方案: 思路如下

  • 单个线程完成单个文件的局部统计 result ,即相当于mr 中 combiner ,
  • 最后在进行结果的汇总 finalResult ,即相当于mr 中 reduce。
  import java.io.File

  import scala.actors.{Actor, Future}

  import scala.collection.mutable

  import scala.io.Source

  class Task extends Actor {

  override def act(): Unit = {

    loop {

      react {

        case SubmitTask(fileName) => {

          val contents = Source.fromFile(new File(fileName)).mkString

          val arr = contents.split("\r\n")

          val result = arr.flatMap(_.split(" ")).map((_, 1)).groupBy(_._1).mapValues(_.length)

          //val result = arr.flatMap(_.split(" ")).map((_, 1)).groupBy(_._1).mapValues(_.foldLeft(0)(_ + _._2))

          sender ! ResultTask(result)

        }

        case StopTask => {

          exit()

        }

      }

    }

  }

}

  object WorkCount {

  def main(args: Array[String]) {

    val files = Array("c://words.txt", "c://words.log")

    val replaySet = new mutable.HashSet[Future[Any]]

    val resultList = new mutable.ListBuffer[ResultTask]

  

    for(f <- files) {

      val t = new Task

      val replay = t.start() !! SubmitTask(f)

      replaySet += replay

    }

  

    while(replaySet.size > 0){

      val toCumpute = replaySet.filter(_.isSet)

      for(r <- toCumpute){

        val result = r.apply()

        resultList += result.asInstanceOf[ResultTask]

        replaySet.remove(r)

      }

      Thread.sleep(100)

    }

    val finalResult = resultList.map(_.result).flatten.groupBy(_._1).mapValues(x => x.foldLeft(0)(_ + _._2))

    println(finalResult)

  }

}

  

  case class SubmitTask(fileName: String)

  case object StopTask

  case class ResultTask(result: Map[String, Int])

 

猜你喜欢

转载自blog.csdn.net/py_tamir/article/details/86520097