使用Cloudera搭建Hadoop开发环境


  由于Hadoop深受客户欢迎,许多公司都推出了各自版本的Hadoop,也有一些公司则围绕Hadoop开发产品。在Hadoop生态系统中,规模最大、知名度最高的公司则是Cloudera。   当然你也可以选择自己下载hadoop源码进行安装hadoop下载,最新版本已经到2.7,建议的安装环境是Ubuntu和CentOS,安装过程可以在网上找到很多参考,这里就不介绍了。   这里我使用Cloudera公司提供的虚拟机(VMware和VirtualBox版本都有),可以很便捷地搭建hadoop开发环境,毕竟我们的主要目的是学习hadoop,不应该把太多时间浪费在环境的配置上。cloudera-quickstart-vm的下载地址是下载链接。选择你需要的版本下载,我用的是VMware,压缩包大小有4G左右,解压后用VMware打开,将CPU改为4个,内存调为8G(你的本机内存不应该小于8G).运行后是一台配置好的CentOS虚拟机,可以很轻松地在上面开发运行Hadoop.


基于schema匹配为基础,计算gml文件结构匹配相似度


起步

这里的schema文档时指定义xml文件结构的.xsd文件,gml其实就是有schema约束的xml文件。

2000年5月,OGC推出了基于XML DTD (Document Type Definitions,文档类型定义)和RDF(Resource Description Frameworks,资源描述框架)的GML 1.0版。

2001年2月,OGC又推出了完全基于XML Schema 的GML 2.0版。

2001年2月,OGC又推出了完全基于XML Schema 的GML 2.0版。2003年2月,GML 3.0版正式发布。

所以,现在gml通用解释:地理标记语言(Geography Markup Language),GML是XML在地理空间信息领域的应用。但在这里只是表示有schema约束的xml文件,注意,不要混了。

github地址:https://github.com/sasukeax/schema_match


git的.gitignore忽略文件


起步

一个项目难免会有一些文件不需要纳入git管理,也不希望他们出现在未跟踪列表,如日志文件,缓存文件,java编译的.class文件或临时文件等.这种情况下,就可以创建一个名为.gitignore文件.windows下不能创建.开头文件的问题自行解决。

配置语法

  • 所有空行或者以 # 开头的行都会被 Git 忽略。
  • 可以使用标准的 glob 模式匹配。
  • 匹配模式可以以 / 开头防止递归。
  • 匹配模式可以以 / 结尾指定目录。
  • 要忽略指定模式以外的文件或目录,可以在模式前加上惊叹号 ! 取反。


我的PHP编码规范


1.文件格式规范

php文件标记

统一以<?php开始,放弃<?短标签,对于只含php代码的文件舍弃?>结尾。

缩进应该能反映代码的逻辑结果

使用tab或者四个空格

多变量赋值保持相等间距和排列

$arr = array(
    'id'        => '0',     //表格索引
    'userid'    => '123',   //所属用户id编号
    'groupid'   => '0',     //所属群组id
    'menuid'    => '0'      //模块id
);


如何安装cuDNN


  cuDNN是英伟达针对CNN(卷积神经网络)推出的一个库,据说可以对CNN过程进行加速,既然这么好,不妨试用一下。下载地址是链接,需要先注册,然后按步骤选择平台下载,现在有v3和v4版本,可以根据你的CUDA版本选择。我选择的是cuDNN v4 Library for Windows。当然也有一些Sample可以下载。   下载后解压得到一个cuda文件夹,可以先将它放到任意位置,比如我放在D盘根目录。   1.然后设置环境变量,将D:\cuda\bin(取决于你的文件位置)添加到系统变量的Path中。   2.用VS新建一个cuda项目(前提是你的CUDA配置完成)。   3.设置项目属性: