用RMI实现基于Java的分布式计算

2009-06-19 14:23:41向您介绍使用RMI实现Java的分布式计算。由于Java具有跨平台、代码可移植性、安全高效等广泛而强大的功能，因而在开发网络Java分布式应用的时候，可以用它自身的机制实现分布式计算。

概述

随着电力企业信息化建设的不断深入和发展，企业内部和企业与企业之间对信息、对数据的交换量大大增加，这些信息与数据越来越需要在不同的计算机网络间传送和交流。同时，由于各单位、各部门之间的现存的计算机网络硬件设备与操作系统千差万别，应用水平也参差不齐，因此，开发出跨平台、可移植、高效安全的网络分布式应用来服务于电力企业，就显得尤为重要。

在当今的编程术语里，分布式计算已经成为很常见的词，它将企业的业务数据和程序分布在网络的不同物理位置上，通过调动网络上多台计算机的处理能力，发挥远程调用数据的功能。

远程方法调用(Remote Method Invocation ,RMI)，可以在不同的Java虚拟机(JVM)之间实现对象与对象的通信。JVM可以位于相同或不同计算机上，在多个JVM中，一个JVM可以调用存储在其它JVM的对象的方法。

本文主要介绍RMI的特点，分析应用RMI进行企业分布式计算的原理，以及利用RMI实现基于Java的企业分布式应用的具体步骤。

远程方法调用(RMI)的特点

1、TCP编程的缺点

由于Java编程语言设计之初就是面向对象和支持网络的，因此，基于对象的RMI机制已经内置在Java分布式计算平台中。

我们经常会在网络开发中使用TCP/IP编程，这样，自然而然地就会涉及到Socket（套接字）编程。但是，使用Socket编程需要大量重复编码，在复杂分布式操作时显得非常麻烦，而且易于出错。因此，如何快速、高效、安全、可扩展地进行网络分布式计算，是开发者们一贯追求和倡导的主题。直到RMI的出现，这种繁杂、低效的开发情况才有很大改观。

2、RMI编程的特点

当我们利用对象序列化在网络上分配对象时，RMI提供了非Java平台无法匹敌的独特而强大的分布式计算模型，RMI主要有以下特点：

客户机可以向本地方法一样调用远程服务器上的方法；

可以根据接口指定客户机/服务器编程合约；

可以从服务器对象缺省二进制类文件，自动生成调动/反调动代码；

将Java编程模型扩展到机器边界(和Java虚拟机(JVM)边界之外)，不需要任何特殊语法；

还可以和一个远程方法调用中的数据同时传输行为(代码)。

尽管RMI不是唯一的企业级远程对象访问方案，但它却是最容易实现的。

3、RMI与CORBA

作为分布式应用程序框架的规范，COBRA首当其冲，它是由对象管理组织(OMG)开发的。与CORBA不同的是，CORBA能够利用不同编程语言（例如C/C++、Basic等）开发实现分布式应用，而RMI是一种纯Java解决方案。在RMI中，程序的所有部分都由Java语言编写，这样，开发出来的程序完全符合Java规范，便于实现跨平台访问、扩展和移植。按照笔者所在西北电力建设集团公司的情况看，服务器操作系统主要有Linux和Windows2000 Server，分别存在于公司和部门当中，它们是不同的系统平台；同时，公司下属各个工程项目部又距离很远，近的几十公里，远则达到上千公里甚至位于国外，因此跨平台和远程访问这两大功能在开发企业应用系统时就必须考虑，而RMI恰恰能够用它的自身特点来满足编程需要。

RMI基本体系结构简介

RMI通过TCP/IP在内部使用Socket，象其名称暗示的那样，它能够帮助我们查找并执行远程对象的方法。RMI的目的是让位于不同JVM中的对象，在外观及行为上都像是本地的对象。

通常，我们把调用这种远程对象的JVM，称为客户机；而把包括这种远程对象的JVM，称为服务器。

尽管对一个远程对象的引用和获得对本地对象的引用有所不同，但我们可以把远程对象像本地对象一样使用。应用程序并不知道一个对象是远程的还是本地的。实际上，远程对象上被调用的方法与本地对象上调用的方法，具有相同的语法结构。

作为RMI的底层（会包含复杂的Socket操作），它会自动截获方法调用，找到远程对象，然后处理远程请求。笔者认为，RMI设计的重要之处，就在于不但在设计上实现了远程访问功能，而且实现了设计的透明性。

RMI的基本体系结构，概括起来说，由三个抽象层组成：

1、存根/框架层(Stubs/Skeletons Layer)

RMI为我们引入了两种特殊类型的对象，称为存根(Stub)和框架(Skeleton),它们组成了RMI的第一层。

在远程通信的时候，要利用TCP/IP协议，做很多底层数据的打包传输。运用Java分布式计算技术，我们先要把数据或者对象转换成字节流(byte stream)，便于网络传输，这个过程叫汇集(marshaling)；当收到远程传来的字节流后，我们要把流信息转换成对象或者数据，这个过程叫解读(unmarshaling),它与汇集刚好相反。

Stub和Skeleton层位于实际应用程序之下，建立在proxy（代理）设计方案之上。Stub类的作用是远程服务器实现的代理的角色，Stub是客户方对象；Skeleton类用于帮助对象通过RMI链接与Stub通信，它从链路中读取方法调用的参数，向远程服务实现对象进行调用，接受返回值，然后再把返回值写回到Stub。

2、远程引用层(Remote Reference Layer)

远程引用层定义和支持着RMI连接的调用语义(semantics)。

RMI进行远程访问要用到JRMP(Java Remote Method Protocol,即Java远程方法协议)，这一层提供专用于JRMP的RemoteRef对象，它位于java.rmi.server包内，代表着远程对象的一个句柄。RemoteRef使用远程引用来执行远程对象的一个远程方法调用。

3、传输层(Transport Layer)

传输层在JVM之间建立基于流的网络连接，并且负责设置和管理这些连接。这时候，RMI使用一种线级(wire-level)协议进行基于TCP/IP的连接，该协议就是Java远程方法协议(JRMP,即Java Remote Method Protocol)。

在JDK版本1.2开始，JRMP不再需要Skeleton,而是使用reflection来建立与远程服务的连接。为了生成Stub，我们须用rmic。

当前的RMI实现中，传输层建立在TCP/IP基础上，设计用于在客户和服务器之间建立一条连接（即使联网有障碍）。

开发的基本步骤

我们使用RMI编写Client/Server模式(客户/服务器)应用程序，包括6个基本步骤：

1) 定义远程接口

2) 实现远程接口

3) 准备远程调用的服务器对象

4) 生成残根Stub(客户代理)和框架Skeleton(服务器实体)

5) 用rmiregistry找到远程对象

6) 运行测试RMI分布式应用#p#

开发企业信息发布系统实例

在开发RMI进行分布式访问之前，需要将各项功能模块化，即把实际应用抽象成符合Java规范的类和接口模型，使这些类和接口之间互相协作，能实现各自独立的功能，最后，可以把它们组合成统一的网络Java分布式计算系统。

现在，我们就以开发公司信息发布系统为例，把主模块(主要的类文件)的名称暂定为InfoDistributeService(信息发布服务)，为了保持应用开发的数据一致性和清晰度，接下来涉及的其它模块命名也将以这个模块命名为基准。

1、定义远程接口

Java RMI运行环境要求任何可以远程调用的方法必须放在远程接口中。

该远程接口用来扩展java.rmi.Remote接口，在Java API中，可以发现它没有任何方法，只是个标志性接口，这样，可以让Java运行环境（JRE）认识每个接口的特殊属性，以便能够远程访问。

因此，按照信息发布服务的命名(InfoDistributeService)，首先须将InfoDistributeRemote定义为远程接口，同时仅放入一个供测试的方法 getRemoteInfo()来实现编码，将所有模块至于新建的enterprise.distribute包中，代码如下：

2、实现远程接口

这是一个实现远程对象的类。如果实现了远程接口，就能够覆盖(override)该对象中的所有方法，因此，远程对象的实现类将真正包含我们希望导出的方法的代码。

在远程信息发布系统中，我们至少实现一个远程接口的对象，它就是远程可访问的对象。这里，InfoDistributeService类可以为我们生成远程可访问对象的实例：

InfoDistributeService类实现远程接口InfoDistributeRemote，并继承java.rmi.server.UnicastRemoteObject。由于符

Java 2 Enterprise Edition（J2EE）远程方法调用（Remote Method Invocation，RMI）框架允许你创建透明的、分布式的服务和应用程序。基于RMI的应用程序由Java对象构成，这些对象相互调用，同时忽略对方的位置。换言之，一个Java对象可调用另一个虚拟机上的某个Java对象的方法，整个过程和调用同一个虚拟机上的某个Java对象的方法无异。

驻留在不同虚拟机上的对象为了相互获得引用，可以使用RMI的查找服务，或者将对象引用作为方法调用的一个参数或者返回值来接收。参数和返回值借助Java的对象序列化机制由RMI来进行封送。

远程对象和接口

Java提供了一个完全限定名称为java.rmi.Remote的接口。任何对象要想参与Java分布式计算和另一个Java对象的远程会话，就必须直接或间接地实现该接口。尤其要注意的是，任何由java.rmi.Remote接口来标识的对象都暗示着它的方法可从其他任何虚拟机进行调用。实现了java.rmi.Remote接口的对象通常称为“远程对象”，必须采用以下方式来声明它的方法：

每个支持远程调用的方法都必须在其throws子句中声明java.rmi.RemoteException。

对于一个可远程调用的方法，它的每个非基本（nonprimitive）参数或者返回值都必须直接或间接地声明为实现了java.io.Serializable接口。

除了实现java.rmi.Remote接口和正确声明任何远程方法之外，Java分布式计算中远程对象必须提供一个无参数的构造函数，它能引发一个java.rmi.RemoteException异常。这就保证了对象可基于一种序列化状态来远程构造。

远程对象必须导出，以接收传入的远程方法调用。为此，你通常需要扩展java.rmi.server.UnicastRemoteObject或者java.rmi.activation.Activatable。通过对其中任何一个类进行扩展，远程对象就可在创建时自动导出。

RMI注册表

为了获取对远程对象的引用，RMI提供了名为注册表（registry）的一个远程对象，它将名称与远程对象关联起来。RMI服务器要向注册表注册每一个远程对象，以便定位和检索对象。RMI客户端希望调用远程对象上的一个方法时，首先必须根据远程对象的名称在注册表中定位远程对象。如果远程对象存在，注册表就返回对那个对象的一个引用。然后，要使用这个引用来发出对远程对象的方法调用。

RMI服务器

RMI采取一种客户机/服务器结构进行通信。这意味着在RMI会话的某一端，必须有一个对象充当服务器，另一端的对象则充当客户端。RMI服务器负责创建每个远程对象的实例，并将每个实例和RMI注册表中的一个名称绑定起来。RMI服务器可以自主，这要求它实现一个main方法，避免必须依赖其他类才能执行。

由于RMI服务器可从几乎任何主机下载和执行代码，所以每个RMI服务器的main方法都需要安装一个安全管理器，防止它所加载的类表现失常。下例展示了如何实例化一个安全管理器，以及如何在RMI注册表中绑定一个对象实例：

小结

【编辑推荐】

什么是J2EE技术

2EE技术纵览 J2EE包含了很多核心技术，它们互相作用，互为补充，共同搭建了java企业应用的坚实平台。 RMI(Remote Method Invocation)提供了一种在不同主机上的Java虚拟机(Java Virtual Machine,JVM)之间进行通信的方式。 RMI能够调用远程主机上的对象，并且就像这个对象在本地虚拟机上一样使用它，RMI也可以动态的加载类和安全管理器，在网络上安全的传输JAVA类 JNDI(Java Naming and Direcotory Interface)是J2EE中用来给对象命名的技术，这里所说的对象包括WEB组件，EJB组件，数据库，文件系统，机器等，J2EE提供的命名和目录服务可以将这些名字和具体的对象绑定在一起，然后应用程序就可以通过这些名字定位这些对象，从而访问用户信息，机器信息和各种服务。 JDBC(Java DateBase Connection)是J2EE中用来访问数据库的技术。利用JDBC API可以在J2EE平台和数据库之间建立连接，在EJB，JSP，Servlets中都可以使用JDBC对数据库进行各种操作，比如查询，修改，存储，管理事务，等。 Java Servletsjava Servlets 技术提供了生成动态WEB内容的基本机制Servlets是一段用来扩展WEB服务器功能的程序，可以看做是服务器端的Java 提供了一种可移植的，独立于平台和WEB服务器的传递动态内容的方法。它从客户接收请求，动态生成响应，然后发送一个包含HTML或XML文档响应给客户。 Servlet是使用java语言编写的，一个平台只要有java虚拟机和一个支持Servlet的Web服务器，就可以支持不需要重新编译就可以运行在不同的平台上。 servlet是在传统的CGI脚本的基础上发展起来的，但与CGI脚本相比，它在可移植性，灵活性及编程性的简易性等方面具有明显的优势。 JSPJAVA SERVER PAGES是构建在java Servlets技术之上的，用来简化动态WEB内容的开发，JSP是一种基于文本的文档，它描述了如何处理一个请求以便产生一个响应，利用JSP技术，用户可以将JAVA代码嵌入HTML标记中去。应用程序可以通过JSP动态生成HTML或XML文档中的动态内容部分。 EJBEnterpris JavaBeans余兴与J2EE服务器中，用来实现商业逻辑和企业计算。它为构建分布式，面向对象的企业应用程序提供了标准的组件体系结构，EJB组件具有可伸缩性，事务性及多拥护安全性的特点，EJB2.0规范定义了三种EJB：会话Bean(Session Bean),实体(Entity Bean)和消息驱动Bean(Message-driven Bean).他们分别完成不同的功能。比如利用实体Bean，我们不必编写SQL语句就可以直接访问数据库。 JTA事务是一些不分分割的工作单位，只有该单元内的所有动作全部得到执行时。它才会被提交，事务可以应用程序组件提供者从错误恢复和多用户编程这些复杂的问题中解脱出来，从而简化应用程序的开发，JTA(java Transaction API)事务能够跨越多个组件和资源管理器。通过使用接口可以创建和管理JTA事务。 JMS消息是应用程序之间通信的一种方式。 JMS(java Message Service)提供了一组java API，应用程序可以使用这些API创建，发送，接收和读取消息，JMS消息包含了一些定义良好，描述特定的商务行为的信息。通过消息的交换，应用程序能够跟踪企业的进程。另一方面它也减少了程序开发人员学习和使用消息服务系统的难度。并尽量保证不同JMS服务提供商之间的兼容性。 JavaMail在网络应用程序中，经常需要发送E-mail,javaMail就是J2EE中用来发送E-mail的一组API，JavaMail API 提供了一系列组成电子邮件的抽象类和接口，这些抽象类和接口支持消息存储，格式和传输的许多不同的实现，此外，JAVAMAIL还包含实现广泛使用的Internet邮件协议和RFC822，RFC2045标准的具体子类，程序开发人员可以使用这些子类实现IMAP4，POP3，SMTP之类的特定消息收发系统 JAAS基于JAAS(Java Authentication and AUthorization Servic)的安全服务可以保证只有授权的用户才可以访问资源。这种访问控制包括两步：一是认证(anthentication),典型的做法就是通过登录，即用户提供认证数据来建立其身份；二是授权(authorization),授权是以安全叫色的概念为基础的，仅当通过认证的用户处于相应的安全角色时，它才被允许访问特定的资源。

Java中Set、List、Map集合类（接口）的特点及区别。分别有哪些常用实现类。

list与Set、Map区别及适用场景1、List,Set都是继承自Collection接口，Map则不是2、List特点：元素有放入顺序，元素可重复，Set特点：元素无放入顺序，元素不可重复，重复元素会覆盖掉，（注意：元素虽然无放入顺序，但是元素在set中的位置是有该元素的HashCode决定的，其位置其实是固定的，加入Set 的Object必须定义equals()方法，另外list支持for循环，也就是通过下标来遍历，也可以用迭代器，但是set只能用迭代，因为他无序，无法用下标来取得想要的值。）和List对比： Set：检索元素效率低下，删除和插入效率高，插入和删除不会引起元素位置改变。 List：和数组类似，List可以动态增长，查找元素效率高，插入删除元素效率低，因为会引起其他元素位置改变。适合储存键值对的数据5.线程安全集合类与非线程安全集合类 LinkedList、ArrayList、HashSet是非线程安全的，Vector是线程安全的;HashMap是非线程安全的，HashTable是线程安全的;StringBuilder是非线程安全的，StringBuffer是线程安全的。下面是具体的使用介绍：ArrayList与LinkedList的区别和适用场景Arraylist：优点：ArrayList是实现了基于动态数组的数据结构,因为地址连续，一旦数据存储好了，查询操作效率会比较高（在内存里是连着放的）。缺点：因为地址连续， ArrayList要移动数据,所以插入和删除操作效率比较低。 LinkedList：优点：LinkedList基于链表的数据结构,地址是任意的，所以在开辟内存空间的时候不需要等一个连续的地址，对于新增和删除操作add和remove，LinedList比较占优势。 LinkedList 适用于要头尾操作或插入指定位置的场景缺点：因为LinkedList要移动指针,所以查询操作性能比较低。适用场景分析：当需要对数据进行对此访问的情况下选用ArrayList，当需要对数据进行多次增加删除修改时采用LinkedList。 ArrayList与Vector的区别和适用场景ArrayList有三个构造方法：Java代码public ArrayList(int initialCapacity)//构造一个具有指定初始容量的空列表。 public ArrayList()//构造一个初始容量为10的空列表。 public ArrayList(Collection c)//构造一个包含指定 collection 的元素的列表 Vector有四个构造方法：Java代码public Vector()//使用指定的初始容量和等于零的容量增量构造一个空向量。 public Vector(int initialCapacity)//构造一个空向量，使其内部数据数组的大小，其标准容量增量为零。 public Vector(Collection c)//构造一个包含指定 collection 中的元素的向量public Vector(int initialCapacity,int capacityIncrement)//使用指定的初始容量和容量增量构造一个空的向量ArrayList和Vector都是用数组实现的，主要有这么三个区别是多线程安全的，线程安全就是说多线程访问同一代码，不会产生不确定的结果。而ArrayList不是，这个可以从源码中看出，Vector类中的方法很多有synchronized进行修饰，这样就导致了Vector在效率上无法与ArrayList相比；2.两个都是采用的线性连续空间存储元素，但是当空间不足的时候，两个类的增加方式是不同。可以设置增长因子，而ArrayList不可以。是一种老的动态数组，是线程同步的，效率很低，一般不赞成使用。适用场景分析是线程同步的，所以它也是线程安全的，而ArrayList是线程异步的，是不安全的。如果不考虑到线程的安全因素，一般用ArrayList效率比较高。 2.如果集合中的元素的数目大于目前集合数组的长度时，在集合中使用数据量比较大的数据，用Vector有一定的优势。 HashSet与Treeset的适用场景是二差树（红黑树的树据结构）实现的,Treeset中的数据是自动排好序的，不允许放入null值是哈希表实现的,HashSet中的数据是无序的，可以放入null，但只能放入一个null，两者中的值都不能重复，就如数据库中唯一约束要求放入的对象必须实现HashCode()方法，放入的对象，是以hashcode码作为标识的，而具有相同内容的String对象，hashcode是一样，所以放入的内容不能重复。但是同一个类的对象可以放入不同的实例适用场景分析:HashSet是基于Hash算法实现的，其性能通常都优于TreeSet。为快速查找而设计的Set，我们通常都应该使用HashSet，在我们需要排序的功能时，我们才使用TreeSet。 HashMap与TreeMap、HashTable的区别及适用场景HashMap 非线程安全HashMap：基于哈希表实现。使用HashMap要求添加的键类明确定义了hashCode()和equals()[可以重写hashCode()和equals()]，为了优化HashMap空间的使用，您可以调优初始容量和负载因子。 TreeMap：非线程安全基于红黑树实现。 TreeMap没有调优选项，因为该树总处于平衡状态。适用场景分析：HashMap和HashTable:HashMap去掉了HashTable的contains方法，但是加上了containsValue()和containsKey()方法。 HashTable同步的，而HashMap是非同步的，效率上比HashTable要高。 HashMap允许空键值，而HashTable不允许。 HashMap：适用于Map中插入、删除和定位元素。 Treemap：适用于按自然顺序或自定义顺序遍历键(key)。

Android 中ArrayList和LinkedList有什么区别

ArrayList采用的是数组形式来保存对象的，这种方式将对象放在连续的位置中，所以最大的缺点就是插入删除时非常麻烦LinkedList采用的将对象存放在独立的空间中，而且在每个空间中还保存下一个链接的索引但是缺点就是查找非常麻烦要丛第一个索引开始Hashtable和HashMap类有三个重要的不同之处。第一个不同主要是历史原因。 Hashtable是基于陈旧的Dictionary类的，HashMap是Java1.2引进的Map接口的一个实现。也许最重要的不同是Hashtable的方法是同步的，而HashMap的方法不是。这就意味着，虽然你可以不用采取任何特殊的行为就可以在一个多线程的应用程序中用一个Hashtable，但你必须同样地为一个HashMap提供外同步。一个方便的方法就是利用Collections类的静态的synchronizedMap()方法，它创建一个线程安全的Map对象，并把它作为一个封装的对象来返回。这个对象的方法可以让你同步访问潜在的HashMap。这么做的结果就是当你不需要同步时，你不能切断Hashtable中的同步（比如在一个单线程的应用程序中），而且同步增加了很多处理费用。第三点不同是，只有HashMap可以让你将空值作为一个表的条目的key或value。 HashMap中只有一条记录可以是一个空的key，但任意数量的条目可以是空的value。这就是说，如果在表中没有发现搜索键，或者如果发现了搜索键，但它是一个空的值，那么get()将返回null。如果有必要，用containKey()方法来区别这两种情况。一些资料建议，当需要同步时，用Hashtable，反之用HashMap。但是，因为在需要时，HashMap可以被同步，HashMap的功能比Hashtable的功能更多，而且它不是基于一个陈旧的类的，所以有人认为，在各种情况下，HashMap都优先于Hashtable。关于Properties有时侯，你可能想用一个hashtable来映射key的字符串到value的字符串。 DOS、Windows和Unix中的环境字符串就有一些例子，如key的字符串PATH被映射到value的字符串C:\WINDOWS;C:\WINDOWS\SYSTEM。 Hashtables是表示这些的一个简单的方法，但Java提供了另外一种方法。类是Hashtable的一个子类，设计用于Stringkeys和values。 Properties对象的用法同Hashtable的用法相象，但是类增加了两个节省时间的方法，你应该知道。 Store()方法把一个Properties对象的内容以一种可读的形式保存到一个文件中。 Load()方法正好相反，用来读取文件，并设定Properties对象来包含keys和values。注意，因为Properties扩展了Hashtable，你可以用超类的put()方法来添加不是String对象的keys和values。这是不可取的。另外，如果你将store()用于一个不包含String对象的Properties对象，store()将失败。作为put()和get()的替代，你应该用setProperty()和getProperty()，它们用String参数。