主题:[原创]汉语编程数据库开发环境技术报告
汉语编程数据库开发环境技术报告
内容摘要:一、汉语编程数据库环境的开发主要采用哪种技术及该技术的特点; 二、使用该技术进行本项目的开发的原因; 三、本项目技术实现过程;第四、数据库基本操作功能; 第五、网络数据库的研究和开发
一、汉语编程数据库环境的开发主要采用哪种技术及该技术的特点
开发汉语编程数据库主要采用汉语编程技术,主要依托汉语编程系统为开发环境,更多体现汉语编程数据库的纯中文性质。汉语程序设计语言(简称汉语编程)是以汉语为描述语言,充分体现汉语言结构和思维方法的计算机语言,由表及里都是依照汉语言的统一规律制成的。它表现出了汉文字、词汇与二进制机械语言的独特亲和力和高度一致,以实现汉语言文化思想和计算机语言有机结合为根本,从而独具特色。
☆ 自成平台:在汉语编程系统下,随语言的出现边扫描边生成代码同时执行。同时本身具有管理磁盘,输入/输出设备的能力,可以直接以它为操作平台进行应用程序的开发。
☆ 所述即所得:汉语程序设计语言的描述方式与汉语言完全相同,只要使用者能够准确地描述需求的全过程,在汉语程序设计平台上录入,就可以编写出程序,达到所需求的目的。
☆ 高度的安全性:汉语程序设计语言具有自己独特的源代码,从内核到外围均能确保其独有性。
☆ 强大的繁衍性功能:汉语程序设计语言以词为基本元素,词与词可以任意进行组合,词又可以生成新词。
☆ 高度兼容:汉语程序设计语言现已经在现有主流操作系统完成了外挂,可以调用这些操作系统中的全部资源,并可将其进行相应改造以适用于不同的运行环境。
☆ 资源占用少、速度快:在任何环境中运行只需很小的空间即可完成全部的操作,简单、高速。
☆ 精巧的嵌入设备:精巧的系统内核可以嵌入任何设备和系统,最小可以到4~8 K。
二、使用该技术进行本项目的开发的原因
1.从汉语程序设计语言应用上来讲。
汉语程序设计语言极高的兼容能力和适应能力,使汉语程序设计语言具有了广泛应用领域,可以在操作系统、网络通讯、教育教学、PC软件等方面进行开发。而汉语编程数据库开发环境是汉语程序设计语言在开发计算机核心级和系统级软件上的一次大胆尝试,探索汉语程序设计语言本身在开发实用软件上的优越性,同时体现汉语编程数据库开发环境从形式到内核真正意义上的自主版权,自主源代码,为开发纯中文的数据系统创造基础条件。
2.计算机数据库系统的发展和民族产业来讲。
数据库技术是现代信息科学技术的重要组成部分,是现代计算机信息系统和计算机应用系统的基础和核心。数据库的使用程度、建设规模、信息的质量和数量,已成为衡量一个国家信息化程度的重要标志之一。
数据库技术对于计算机来说是一个古老的课题,近年来由于没有计算机语言模式的更新,数据库技术没有质的变化。我国计算机起步较晚,而在数据库领域大量现存的数据软件可使用,使得中国的数据库技术亦步亦趋追随国外,在数据库技术上基本没有进行独立的开发,也没有取得实质上的进展。我国数据库开发唯有走发展民族化,自立更生的道路才是方向,否则除向西方支付巨额版权费用以外,还要受别人控制。
就目前世界数据库软件生产格局来看,数据库技术已不是高不可及的尖端技术,其主要精髓在于对计算机语言的设计。而我们现在已拥有了自主版权、自主源代码的汉语程序设计语言,为汉语编程数据库开发环境完成了基础搭建。
3.安全性上来讲.。
计算机的安全问题虽着计算机技术的发展而日趋明显,国家的信息化工程作为国家管理现代化关键的一步,此外国防、航空航天、金融、证券、商业……几乎各行各业都需要自主版权的、安全、高效的数据库软件。以汉语程序设计语言为开发平台,汉语编程系统为运行环境,使得汉语编程数据库开发环境从内核、结构、到形式实现真正的自主源代码,自主版权的纯中文数据库开发软件。汉语程序设计语言的高度安全性,汉语编程数据库开发环境保证了数据的安全处理和传输。
4.从市场经济上来讲。
随着计算机及其网络技术的迅速发展和普及,政府、企业的上网工程和办公自动化全面开展和深入,数据库技术也越来越重要。然而在数据库的使用上,我国一直延用国外的技术和产品,在国内数据库软件市场上根本找不到自主源代码,自主版权真正意义上的数据系统,除了支付高额的版权费外,在数据库安全问题上引起各行各业的重视。自主版权,自主源代码的数据库软件越来越受到青睐。据统计,数据库软件全世界每年的销售额约1000亿美元,定价从3000美元~80000美元不等;数据库软件的价格根据功能而定,企业专用的通常价格为20000美元以上。Oracle数据库软件为50000~80000美金/套。在我国,2000年国家提出政府上网投资为1000亿,需要数据库技术的企业有120万个,中国学生1.5亿,初中以上为6000万,光在教育领域预计每年将会有60万的需求量。用自主版权,自主源代码的汉语程序设计语言作为汉语成设计语言数据库开发环境的开发工具,大大降低了开发成本,使得汉语编程数据库软件的市场销售价格远远低于国外数据库软件,例如汉语编程数据库(学习版)开发完成后向市场发售,市场定价暂定为10元人民币/套,大量面向教育领域推广,一个普通的学生都能支付。利用汉语程序设计语言开发的汉语编程数据库开发环境将以低价格,高安全,高效、稳定成为数据库软件市场上的一支新力军,受到各行各业的重视。
三、本项目技术实现过程
1. 汉语程序设计语言
计算机内部的CPU指令的标识就象汉语一样,其指令本身并无语法约束,每一个指令就相当于一个单字或偏旁部首。但这些指令与汉语直接使用的词语之间联系有很小,所以我们没必要将CPU的指令翻译成汉语词作为指令的标识,我们只希望用这些指令集合体去建立机器执行功能的标识过程,并用汉语中的一个词标识此功能。对于新增加汉语标识,我们可以在其它机器执行功能标识过程中使用,也就是说在编写程序中可以用新定义的词描述。试想我们在描述过程中始终围绕我们自然语言习惯,选择适当的汉语词语,并用这些词语适当地搭配编写新的程序,程序的形式主要取决所选择的汉语标识,换句话说,是围绕如何组织文章和句子去选择词语,而不是据程序的功能和性质赋予其代号。发展下去,编程的水平就越来越依赖与编程人员的语文和具体专业水平。而摆脱计算机语句对编程人员的约束。
如果我们将计算机CPU的指令看作是文字的偏旁部首, 由这些偏旁部首可以组成单字,那么我们可以用汉字作为标识名,我们规定如下的格式:
汇编 <词名> <指令序列> 汇编。
“汇编”表示开始描述功能为<词名>的程序,其中的实体是<指令序列>。在表述完了<词名>的全部操作过程后,用“汇编。”表示结束这段功能描述。如果合法,那么就完成了此项标识过程。其中<词名>标识了<指令序列>操作过程。这样就有了单字。上述工作主要是由提供汉语编程系统的开发者完成,有时用户也可以参与标识这些基本的单字。
有了基本的单字之后,我们可以建立由“字组成词”的标识过程。由于我们习惯说“编程序”,所以标识过程开始就以“编”开头,然后是<词名>,接下来用原有的词去描述所要建立功能,形成了一句话,结束时用句号“。”。如系统中已经有一个词为“个空格”,而要标识一个新的词为“空格”就可使用:
编 空格 1 个空格 。
通常情况下系统开发者根据上述两种方法标识必要的单字,一般的程序设计员按后一种方法编程,偶尔也采用前一种方法。
再如在汉语编程系统中数是放在数摞上的,对于希望重复使用的数需要进行“复印”,我们用一个形象符号“♂”表达。如果我们将数摞上的一个数通过“♂”复制后再由“*”相乘就是一个平方运算的过程,那么我们可以用汉字“平方”来标识这个功能:
编 平方 ♂ * 。
这上述程序编完之后,平方这个程序就被完整地标识在汉语编程系统中,或者是编入了词典。“平方”这个名称标识了“♂ * ”的功能。如果编程序中需要用到“平方”这个词时,同样可以直接使用。
编 四次方 平方 平方 。
显然,四次方的标识过程实际上与计算机无关,因为这里惟独使用了用户自己标识的“平方”这个词。“平方”词名是根据编程者的语文知识和专业知识决定。由此可以想象,无论一个多么高级的功能描述,都可根据所具备的语文和专业知识对其进行分级描述,并建立完整的标识过程,只是最后极简单的部分才归结到汉语编程系统提供的词语上。这样程序设计就直接利用古今百科知识。
以上所讲述的是汉语编程实现的基本原理及其过程,与西方的语言可能存在着较大的差距,但却体现了汉语言文化的精髓——“边旁到字,字生词,词组句、句成文”。
2. 汉语编程数据库开发环境的实现
汉语编程数据库系统核的设计与开发中,主要利用汉语编程特有的数摞机制实现了对不定长指令的处理、数据库编译解释器的设计以及词典管理功能。
第一、数摞
是汉语编程所特有的一种数据结构。数摞操作是汉语编程特有的表达方法和数据运算方式,将汉字字符集中的图形符号引入数摞操作的表达,就产生对意识流和数据流自然分开的编程习惯,大大地增强了程序设计的意识效果。一切的操作与运算过程的操作数都将从数摞上取得,而操作结果也将放在数摞顶。数摞与堆栈概念不同,堆栈是一种先进后出的数据结构,而数摞依靠数摞操作可以随意地对数据进行重排序和计算等特点。在实际的使用或程序中用户可通过系统提供的一系列数摞操作符,对数摞中的数据进行随意调整,以满足不同需要。为了提高数据的处理速度以及避免烦琐的优先级问题,数摞采用了后缀表示法。
第二、词典结构
a.词的结构:汉语编程系统运行时的系统的词典是在内存中。当“编”一个新词,汉语编程系统就会在当前的“可用地址”处生成新词,然后从低地址向高地址将一个词所应具备的内容编译到词典中。汉语编程的词由名称域地址、连接域地址、属性域地址、实体域地址等四部分组成。
b.词性的区分:汉语编程系统词典中有很多不同词性的词,如常数和变量。不同词性的词所不同的地方只是在属性域和实体域。
c.词典内存结构
┆
用户词典区
(当前可用地址)
任务变量区
缓冲区
核心词典区
第三、虚拟机
词典结构是汉语编程语言的基本骨架,所以汉语编程语言生成的词都在词典中具有及其规范的格式。汉语程序运行时根据不同词生成目标代码基本上都是一系列的地址,对于计算机来说这些地址是不能够直接执行的,而是通过一个虚拟的“数摞计算机”来执行这些地址流,我们称其为虚拟机。
汉语编程虚拟机是直接面向计算机系统指令的,当汉语程序的地址流输入时虚拟机将其解释并执行。对于不同的操作平台即跨系统移植时,只需将汉语编程虚拟机根据不同平台的指令进行相应的修改就可在不同系统中运行汉语编程系统了。
系统采用虚拟机技术,通过虚拟机可以直接执行汉语编程系统词典中以地址为目标码的“宏指令”,对“宏指令”或程序指令的执行是通过执行词典中的系统词来运行的,分实际上每个“宏指令”或一段可复用的程序段都被编译在词典指定的的位置。三种技术的结合便组成了汉语编程数据库系统的核心部分。通常系统在执行一个“宏指令”或一段程序时,系统通过查询系统词典,会把该“宏指令”或程序的运行地址放在数摞的顶上,然后系统虚拟机会从数摞上取得程序的运行地址来执行。
3.汉语编程数据库实现的技术路线
使用拥有自主源代码、自主版权的汉语程序设计语言进行汉语编程系统数据库开发环境的内核开发,在实际应用中不断完善和发展,随着汉语程序设计语言系统的不断完善,应用项目的增多,汉语编程系统数据库开发环境也在不断的走创新之路。汉语编程系统数据库开发环境将一直坚持走边应用边开发,分布式结构滚动式发展的技术路线。
4.汉语编程数据库开发环境
研制汉语编程数据库开发环境主要实现了二维表结构的设计、数据文件的组织、实现与改进等。
第一、对汉语编程数据库的创建、打开和关闭:
串建库文件 建库文件 建新项 项名改
项长度改 项类型改 项偏移改 项小数位改
串使用库 使用库 当前区 当前区块地址
结束使用 区使用 作为当前区 项列表
项号 项名 项类型 项长度
项偏移 项小数位 项总数
其中“建库文件”和“串建库文件”两词是用于建立数据库结构用的,这两个功能词只是使用方式不同,实现功能一样。
项总数、项号、项名、项名改、项长度、项长度改、项类型、项类型改、项偏移、项偏移改、建新项等这些词是用于对数据库表结构的操作而建立的,主要是针对项(字段)的名称、长度、类型的操作,为了用户能更方便地看到一个库的结构,开发了“项列表”一词;
使用“使用库”和“串使用库”来完成对数据库的打开操作。使用“结束使用”来关闭已打开的数据库。
使用“作为当前区”、“区使用”、“当前区块地址”、“当前区”等词来完成多个数据库文件之间的切换使用,但不是当前使用的库的头指针地址,将其作为当前的库进行操作。此外在此基础上,还开始了对项内小数位的定位设计,为后来开发数值型的项的修改做准备。
第二、语编程数据库和VF的兼容接口的设计与开发
通过对VF结构的剖析,结合汉语编程数据库二维表自身的特点,实现了和VF的完全兼容。在有成功经验的基础上进一步对其他数据库产品的研究初步实现了汉语编程数据库和其他数据库通用接口的设计。
第三、汉语编程数据库数据类型的建立、完善,
在建立汉语编程数据库的数据类型时起初考虑到和VF的完全兼容,数据类型沿用了字符的格式如: ''C''、''N''、''Y''、''I''、''D''、''L'' 等,后来增加了汉语编程特有的类型后使用了自己的表示形式如: 字符型、数值型、货币型、逻辑型、整数型、双数型、日期型、日期字符型、数组型等。
双数型数据类型的增加是为了满足有特大数据用户的需要,双数型数据使用64位来表示一个数值,表示数的范围在-9223372036854775807~+18446744073709551615之间,双数型数据在数摞上是使用两层表示的。
汉语编程数据库的数组类型可以使得数据库的每一项可存放一组数据,这样不仅提高了对数据的提取速度,而且和可以节约存储空间,通过使用数组型,我们可以在一条记录的一个项中存储多维空间的一个点的坐标、进而可以记录下对多维空间处理的路径。
对日期型和日期字符型的处理,汉语编程数据库采用了国人的使用习惯,对他的输入和显示都使用XX年XX月XX日 或 XX年XX月XX日XX时XX分XX秒的形式,其中还解决了平年、闰年及2000年问题。
第四、数据库基本操作功能
针对记录的实际操作:记录定位、显示、增加、删除和修改、查询,设计出了以下的词:
为当前记录 为全程记录 头记录 上一条记录
下一条记录 尾记录 记录显 库显
空出一条记录空间 加空记录 替换 做删除标记
删除已标记记录 过滤条件 置为过滤 库过滤显
汉语编程数据库的每一个操作功能词都可以直接对数据库记录进行操作,其中对数据库记录的定位是通过头记录、上一条记录、下一条记录、尾记录、记录、为当前记录等词来完成;
对记录的显示是通过记录显、库显来完成的;同时开发出了用于记录的增、删、改、查询的词。对数据库记录的添加通过加空记录、替换来完成的;“替换”一词用于数据库记录内容的添加和修改,其内部包含了对汉语编程数据库各种类型数据的替换: 信息项替换、(信息项替换)、日期字符项替换、(日期时间项替换)、日期项替换、(日期项替换)、逻辑项替换、(逻辑项替换)、整数项替换 (整数项替换)、数组项替换、(数组项替换)、实数项替换、(实数项替换)、货币项替换、(货币项替换)、双数项替换、(双数项替换)、数值项替换、(数值项替换)、字符项替换、(字符项替换);根据实际需要系统又增加了插空记录和追加记录两个词来完善对数据库记录的增加。
对汉语编程数据库记录的删除是通过做删除标记、删除已标记记录等词来完成的;由于其他工作的需要系统又增加了删除一条标记记录、记录全恢复 记录恢复、全做删除标记等功能词。
对数据库记录的快速查询,是反映一个数据库性能好坏的重要标志,对汉语编程数据库记录的查询是通过过滤条件、置为过滤、取消过滤、过滤条件改等词结合汉语编程数据库特有的查询优化技术来完成的,在此基础上后期又开发了数据库的模糊过滤功能词,他们有:货币型模糊过滤处理、日期型模糊过滤处理、实型模糊过滤处理、整型模糊过滤处理、字符型模糊过滤。
第五、网络数据库的研究和开发
包括基本网络架构的研究、数据在网络上的加密传输、数据库数据在局域网上传输的检测、面向互联网数据的访问、数据库数据在互联网上的安全传输、网络数据库构架的形成与应用七方面。
对汉语编程网络数据库的研究和开发,首先从基本的网络架构的研究、数据在网络上的加密传输开始的,开发下列网络功能词来完成网络架构的搭建:
发送套接字 监听套接字 服务器地址结构长度 服务器地址
WSADATA数据 获取远程地址 公布本机地址 置默认标识
置访问标识 置服务标识 服务标识 本机地址
服务句柄 会话句柄 清参数 置参数
口令字 用户名 服务器 解密
加密 密位 接受连接请求 监听本地端口
绑定本地端口 >网络字节顺序 注册客户端网络消息 注册服务器端网络消息
注册网络消息 SOCK连接 SOCK接收 SOCK发送
非锁定模式 取本地IP >主机地址 获取注册服务端口号
从容关闭套接字 强行关闭套接字 建立套接字 释放WINSOCK库
加载WINSOCK库 INET主机名
在网络架构的基础上开发了网络数据库功能词:
这些功能词主要用来完成网络的启动、连接、数据的下载及上载功能
数据上载 数据下载 打开本客户库 打开客户库
打开共用库 断开连接 登录服务端 呼叫服务端
网库结束使用 关闭数据库服务 启动数据库服务 网库使用
客户可使用 删除网络客户 增加网络客户 建网库
设为减量项 设为增量项 网络数据服务端口
第六. 网络编程工具的开发
根据开发一些中大型项目开发的需要,汉语编程数据库开发环境有增添了一些实用工具:
启动本地连接 启动远程连接 库结构维护 服务端描述库
网络客户管理 网络数据库校验 增减项管理 DSNSER(广域网注册)
汉语编程系统数据库开发环境经过近两年的开发,技术已逐步成熟,在实际的项目应用中也取得了很好的效果,随着项目应用的不断深入汉语编程系统数据库开发环境还将逐步完善。
内容摘要:一、汉语编程数据库环境的开发主要采用哪种技术及该技术的特点; 二、使用该技术进行本项目的开发的原因; 三、本项目技术实现过程;第四、数据库基本操作功能; 第五、网络数据库的研究和开发
一、汉语编程数据库环境的开发主要采用哪种技术及该技术的特点
开发汉语编程数据库主要采用汉语编程技术,主要依托汉语编程系统为开发环境,更多体现汉语编程数据库的纯中文性质。汉语程序设计语言(简称汉语编程)是以汉语为描述语言,充分体现汉语言结构和思维方法的计算机语言,由表及里都是依照汉语言的统一规律制成的。它表现出了汉文字、词汇与二进制机械语言的独特亲和力和高度一致,以实现汉语言文化思想和计算机语言有机结合为根本,从而独具特色。
☆ 自成平台:在汉语编程系统下,随语言的出现边扫描边生成代码同时执行。同时本身具有管理磁盘,输入/输出设备的能力,可以直接以它为操作平台进行应用程序的开发。
☆ 所述即所得:汉语程序设计语言的描述方式与汉语言完全相同,只要使用者能够准确地描述需求的全过程,在汉语程序设计平台上录入,就可以编写出程序,达到所需求的目的。
☆ 高度的安全性:汉语程序设计语言具有自己独特的源代码,从内核到外围均能确保其独有性。
☆ 强大的繁衍性功能:汉语程序设计语言以词为基本元素,词与词可以任意进行组合,词又可以生成新词。
☆ 高度兼容:汉语程序设计语言现已经在现有主流操作系统完成了外挂,可以调用这些操作系统中的全部资源,并可将其进行相应改造以适用于不同的运行环境。
☆ 资源占用少、速度快:在任何环境中运行只需很小的空间即可完成全部的操作,简单、高速。
☆ 精巧的嵌入设备:精巧的系统内核可以嵌入任何设备和系统,最小可以到4~8 K。
二、使用该技术进行本项目的开发的原因
1.从汉语程序设计语言应用上来讲。
汉语程序设计语言极高的兼容能力和适应能力,使汉语程序设计语言具有了广泛应用领域,可以在操作系统、网络通讯、教育教学、PC软件等方面进行开发。而汉语编程数据库开发环境是汉语程序设计语言在开发计算机核心级和系统级软件上的一次大胆尝试,探索汉语程序设计语言本身在开发实用软件上的优越性,同时体现汉语编程数据库开发环境从形式到内核真正意义上的自主版权,自主源代码,为开发纯中文的数据系统创造基础条件。
2.计算机数据库系统的发展和民族产业来讲。
数据库技术是现代信息科学技术的重要组成部分,是现代计算机信息系统和计算机应用系统的基础和核心。数据库的使用程度、建设规模、信息的质量和数量,已成为衡量一个国家信息化程度的重要标志之一。
数据库技术对于计算机来说是一个古老的课题,近年来由于没有计算机语言模式的更新,数据库技术没有质的变化。我国计算机起步较晚,而在数据库领域大量现存的数据软件可使用,使得中国的数据库技术亦步亦趋追随国外,在数据库技术上基本没有进行独立的开发,也没有取得实质上的进展。我国数据库开发唯有走发展民族化,自立更生的道路才是方向,否则除向西方支付巨额版权费用以外,还要受别人控制。
就目前世界数据库软件生产格局来看,数据库技术已不是高不可及的尖端技术,其主要精髓在于对计算机语言的设计。而我们现在已拥有了自主版权、自主源代码的汉语程序设计语言,为汉语编程数据库开发环境完成了基础搭建。
3.安全性上来讲.。
计算机的安全问题虽着计算机技术的发展而日趋明显,国家的信息化工程作为国家管理现代化关键的一步,此外国防、航空航天、金融、证券、商业……几乎各行各业都需要自主版权的、安全、高效的数据库软件。以汉语程序设计语言为开发平台,汉语编程系统为运行环境,使得汉语编程数据库开发环境从内核、结构、到形式实现真正的自主源代码,自主版权的纯中文数据库开发软件。汉语程序设计语言的高度安全性,汉语编程数据库开发环境保证了数据的安全处理和传输。
4.从市场经济上来讲。
随着计算机及其网络技术的迅速发展和普及,政府、企业的上网工程和办公自动化全面开展和深入,数据库技术也越来越重要。然而在数据库的使用上,我国一直延用国外的技术和产品,在国内数据库软件市场上根本找不到自主源代码,自主版权真正意义上的数据系统,除了支付高额的版权费外,在数据库安全问题上引起各行各业的重视。自主版权,自主源代码的数据库软件越来越受到青睐。据统计,数据库软件全世界每年的销售额约1000亿美元,定价从3000美元~80000美元不等;数据库软件的价格根据功能而定,企业专用的通常价格为20000美元以上。Oracle数据库软件为50000~80000美金/套。在我国,2000年国家提出政府上网投资为1000亿,需要数据库技术的企业有120万个,中国学生1.5亿,初中以上为6000万,光在教育领域预计每年将会有60万的需求量。用自主版权,自主源代码的汉语程序设计语言作为汉语成设计语言数据库开发环境的开发工具,大大降低了开发成本,使得汉语编程数据库软件的市场销售价格远远低于国外数据库软件,例如汉语编程数据库(学习版)开发完成后向市场发售,市场定价暂定为10元人民币/套,大量面向教育领域推广,一个普通的学生都能支付。利用汉语程序设计语言开发的汉语编程数据库开发环境将以低价格,高安全,高效、稳定成为数据库软件市场上的一支新力军,受到各行各业的重视。
三、本项目技术实现过程
1. 汉语程序设计语言
计算机内部的CPU指令的标识就象汉语一样,其指令本身并无语法约束,每一个指令就相当于一个单字或偏旁部首。但这些指令与汉语直接使用的词语之间联系有很小,所以我们没必要将CPU的指令翻译成汉语词作为指令的标识,我们只希望用这些指令集合体去建立机器执行功能的标识过程,并用汉语中的一个词标识此功能。对于新增加汉语标识,我们可以在其它机器执行功能标识过程中使用,也就是说在编写程序中可以用新定义的词描述。试想我们在描述过程中始终围绕我们自然语言习惯,选择适当的汉语词语,并用这些词语适当地搭配编写新的程序,程序的形式主要取决所选择的汉语标识,换句话说,是围绕如何组织文章和句子去选择词语,而不是据程序的功能和性质赋予其代号。发展下去,编程的水平就越来越依赖与编程人员的语文和具体专业水平。而摆脱计算机语句对编程人员的约束。
如果我们将计算机CPU的指令看作是文字的偏旁部首, 由这些偏旁部首可以组成单字,那么我们可以用汉字作为标识名,我们规定如下的格式:
汇编 <词名> <指令序列> 汇编。
“汇编”表示开始描述功能为<词名>的程序,其中的实体是<指令序列>。在表述完了<词名>的全部操作过程后,用“汇编。”表示结束这段功能描述。如果合法,那么就完成了此项标识过程。其中<词名>标识了<指令序列>操作过程。这样就有了单字。上述工作主要是由提供汉语编程系统的开发者完成,有时用户也可以参与标识这些基本的单字。
有了基本的单字之后,我们可以建立由“字组成词”的标识过程。由于我们习惯说“编程序”,所以标识过程开始就以“编”开头,然后是<词名>,接下来用原有的词去描述所要建立功能,形成了一句话,结束时用句号“。”。如系统中已经有一个词为“个空格”,而要标识一个新的词为“空格”就可使用:
编 空格 1 个空格 。
通常情况下系统开发者根据上述两种方法标识必要的单字,一般的程序设计员按后一种方法编程,偶尔也采用前一种方法。
再如在汉语编程系统中数是放在数摞上的,对于希望重复使用的数需要进行“复印”,我们用一个形象符号“♂”表达。如果我们将数摞上的一个数通过“♂”复制后再由“*”相乘就是一个平方运算的过程,那么我们可以用汉字“平方”来标识这个功能:
编 平方 ♂ * 。
这上述程序编完之后,平方这个程序就被完整地标识在汉语编程系统中,或者是编入了词典。“平方”这个名称标识了“♂ * ”的功能。如果编程序中需要用到“平方”这个词时,同样可以直接使用。
编 四次方 平方 平方 。
显然,四次方的标识过程实际上与计算机无关,因为这里惟独使用了用户自己标识的“平方”这个词。“平方”词名是根据编程者的语文知识和专业知识决定。由此可以想象,无论一个多么高级的功能描述,都可根据所具备的语文和专业知识对其进行分级描述,并建立完整的标识过程,只是最后极简单的部分才归结到汉语编程系统提供的词语上。这样程序设计就直接利用古今百科知识。
以上所讲述的是汉语编程实现的基本原理及其过程,与西方的语言可能存在着较大的差距,但却体现了汉语言文化的精髓——“边旁到字,字生词,词组句、句成文”。
2. 汉语编程数据库开发环境的实现
汉语编程数据库系统核的设计与开发中,主要利用汉语编程特有的数摞机制实现了对不定长指令的处理、数据库编译解释器的设计以及词典管理功能。
第一、数摞
是汉语编程所特有的一种数据结构。数摞操作是汉语编程特有的表达方法和数据运算方式,将汉字字符集中的图形符号引入数摞操作的表达,就产生对意识流和数据流自然分开的编程习惯,大大地增强了程序设计的意识效果。一切的操作与运算过程的操作数都将从数摞上取得,而操作结果也将放在数摞顶。数摞与堆栈概念不同,堆栈是一种先进后出的数据结构,而数摞依靠数摞操作可以随意地对数据进行重排序和计算等特点。在实际的使用或程序中用户可通过系统提供的一系列数摞操作符,对数摞中的数据进行随意调整,以满足不同需要。为了提高数据的处理速度以及避免烦琐的优先级问题,数摞采用了后缀表示法。
第二、词典结构
a.词的结构:汉语编程系统运行时的系统的词典是在内存中。当“编”一个新词,汉语编程系统就会在当前的“可用地址”处生成新词,然后从低地址向高地址将一个词所应具备的内容编译到词典中。汉语编程的词由名称域地址、连接域地址、属性域地址、实体域地址等四部分组成。
b.词性的区分:汉语编程系统词典中有很多不同词性的词,如常数和变量。不同词性的词所不同的地方只是在属性域和实体域。
c.词典内存结构
┆
用户词典区
(当前可用地址)
任务变量区
缓冲区
核心词典区
第三、虚拟机
词典结构是汉语编程语言的基本骨架,所以汉语编程语言生成的词都在词典中具有及其规范的格式。汉语程序运行时根据不同词生成目标代码基本上都是一系列的地址,对于计算机来说这些地址是不能够直接执行的,而是通过一个虚拟的“数摞计算机”来执行这些地址流,我们称其为虚拟机。
汉语编程虚拟机是直接面向计算机系统指令的,当汉语程序的地址流输入时虚拟机将其解释并执行。对于不同的操作平台即跨系统移植时,只需将汉语编程虚拟机根据不同平台的指令进行相应的修改就可在不同系统中运行汉语编程系统了。
系统采用虚拟机技术,通过虚拟机可以直接执行汉语编程系统词典中以地址为目标码的“宏指令”,对“宏指令”或程序指令的执行是通过执行词典中的系统词来运行的,分实际上每个“宏指令”或一段可复用的程序段都被编译在词典指定的的位置。三种技术的结合便组成了汉语编程数据库系统的核心部分。通常系统在执行一个“宏指令”或一段程序时,系统通过查询系统词典,会把该“宏指令”或程序的运行地址放在数摞的顶上,然后系统虚拟机会从数摞上取得程序的运行地址来执行。
3.汉语编程数据库实现的技术路线
使用拥有自主源代码、自主版权的汉语程序设计语言进行汉语编程系统数据库开发环境的内核开发,在实际应用中不断完善和发展,随着汉语程序设计语言系统的不断完善,应用项目的增多,汉语编程系统数据库开发环境也在不断的走创新之路。汉语编程系统数据库开发环境将一直坚持走边应用边开发,分布式结构滚动式发展的技术路线。
4.汉语编程数据库开发环境
研制汉语编程数据库开发环境主要实现了二维表结构的设计、数据文件的组织、实现与改进等。
第一、对汉语编程数据库的创建、打开和关闭:
串建库文件 建库文件 建新项 项名改
项长度改 项类型改 项偏移改 项小数位改
串使用库 使用库 当前区 当前区块地址
结束使用 区使用 作为当前区 项列表
项号 项名 项类型 项长度
项偏移 项小数位 项总数
其中“建库文件”和“串建库文件”两词是用于建立数据库结构用的,这两个功能词只是使用方式不同,实现功能一样。
项总数、项号、项名、项名改、项长度、项长度改、项类型、项类型改、项偏移、项偏移改、建新项等这些词是用于对数据库表结构的操作而建立的,主要是针对项(字段)的名称、长度、类型的操作,为了用户能更方便地看到一个库的结构,开发了“项列表”一词;
使用“使用库”和“串使用库”来完成对数据库的打开操作。使用“结束使用”来关闭已打开的数据库。
使用“作为当前区”、“区使用”、“当前区块地址”、“当前区”等词来完成多个数据库文件之间的切换使用,但不是当前使用的库的头指针地址,将其作为当前的库进行操作。此外在此基础上,还开始了对项内小数位的定位设计,为后来开发数值型的项的修改做准备。
第二、语编程数据库和VF的兼容接口的设计与开发
通过对VF结构的剖析,结合汉语编程数据库二维表自身的特点,实现了和VF的完全兼容。在有成功经验的基础上进一步对其他数据库产品的研究初步实现了汉语编程数据库和其他数据库通用接口的设计。
第三、汉语编程数据库数据类型的建立、完善,
在建立汉语编程数据库的数据类型时起初考虑到和VF的完全兼容,数据类型沿用了字符的格式如: ''C''、''N''、''Y''、''I''、''D''、''L'' 等,后来增加了汉语编程特有的类型后使用了自己的表示形式如: 字符型、数值型、货币型、逻辑型、整数型、双数型、日期型、日期字符型、数组型等。
双数型数据类型的增加是为了满足有特大数据用户的需要,双数型数据使用64位来表示一个数值,表示数的范围在-9223372036854775807~+18446744073709551615之间,双数型数据在数摞上是使用两层表示的。
汉语编程数据库的数组类型可以使得数据库的每一项可存放一组数据,这样不仅提高了对数据的提取速度,而且和可以节约存储空间,通过使用数组型,我们可以在一条记录的一个项中存储多维空间的一个点的坐标、进而可以记录下对多维空间处理的路径。
对日期型和日期字符型的处理,汉语编程数据库采用了国人的使用习惯,对他的输入和显示都使用XX年XX月XX日 或 XX年XX月XX日XX时XX分XX秒的形式,其中还解决了平年、闰年及2000年问题。
第四、数据库基本操作功能
针对记录的实际操作:记录定位、显示、增加、删除和修改、查询,设计出了以下的词:
为当前记录 为全程记录 头记录 上一条记录
下一条记录 尾记录 记录显 库显
空出一条记录空间 加空记录 替换 做删除标记
删除已标记记录 过滤条件 置为过滤 库过滤显
汉语编程数据库的每一个操作功能词都可以直接对数据库记录进行操作,其中对数据库记录的定位是通过头记录、上一条记录、下一条记录、尾记录、记录、为当前记录等词来完成;
对记录的显示是通过记录显、库显来完成的;同时开发出了用于记录的增、删、改、查询的词。对数据库记录的添加通过加空记录、替换来完成的;“替换”一词用于数据库记录内容的添加和修改,其内部包含了对汉语编程数据库各种类型数据的替换: 信息项替换、(信息项替换)、日期字符项替换、(日期时间项替换)、日期项替换、(日期项替换)、逻辑项替换、(逻辑项替换)、整数项替换 (整数项替换)、数组项替换、(数组项替换)、实数项替换、(实数项替换)、货币项替换、(货币项替换)、双数项替换、(双数项替换)、数值项替换、(数值项替换)、字符项替换、(字符项替换);根据实际需要系统又增加了插空记录和追加记录两个词来完善对数据库记录的增加。
对汉语编程数据库记录的删除是通过做删除标记、删除已标记记录等词来完成的;由于其他工作的需要系统又增加了删除一条标记记录、记录全恢复 记录恢复、全做删除标记等功能词。
对数据库记录的快速查询,是反映一个数据库性能好坏的重要标志,对汉语编程数据库记录的查询是通过过滤条件、置为过滤、取消过滤、过滤条件改等词结合汉语编程数据库特有的查询优化技术来完成的,在此基础上后期又开发了数据库的模糊过滤功能词,他们有:货币型模糊过滤处理、日期型模糊过滤处理、实型模糊过滤处理、整型模糊过滤处理、字符型模糊过滤。
第五、网络数据库的研究和开发
包括基本网络架构的研究、数据在网络上的加密传输、数据库数据在局域网上传输的检测、面向互联网数据的访问、数据库数据在互联网上的安全传输、网络数据库构架的形成与应用七方面。
对汉语编程网络数据库的研究和开发,首先从基本的网络架构的研究、数据在网络上的加密传输开始的,开发下列网络功能词来完成网络架构的搭建:
发送套接字 监听套接字 服务器地址结构长度 服务器地址
WSADATA数据 获取远程地址 公布本机地址 置默认标识
置访问标识 置服务标识 服务标识 本机地址
服务句柄 会话句柄 清参数 置参数
口令字 用户名 服务器 解密
加密 密位 接受连接请求 监听本地端口
绑定本地端口 >网络字节顺序 注册客户端网络消息 注册服务器端网络消息
注册网络消息 SOCK连接 SOCK接收 SOCK发送
非锁定模式 取本地IP >主机地址 获取注册服务端口号
从容关闭套接字 强行关闭套接字 建立套接字 释放WINSOCK库
加载WINSOCK库 INET主机名
在网络架构的基础上开发了网络数据库功能词:
这些功能词主要用来完成网络的启动、连接、数据的下载及上载功能
数据上载 数据下载 打开本客户库 打开客户库
打开共用库 断开连接 登录服务端 呼叫服务端
网库结束使用 关闭数据库服务 启动数据库服务 网库使用
客户可使用 删除网络客户 增加网络客户 建网库
设为减量项 设为增量项 网络数据服务端口
第六. 网络编程工具的开发
根据开发一些中大型项目开发的需要,汉语编程数据库开发环境有增添了一些实用工具:
启动本地连接 启动远程连接 库结构维护 服务端描述库
网络客户管理 网络数据库校验 增减项管理 DSNSER(广域网注册)
汉语编程系统数据库开发环境经过近两年的开发,技术已逐步成熟,在实际的项目应用中也取得了很好的效果,随着项目应用的不断深入汉语编程系统数据库开发环境还将逐步完善。