Java OCR tesseract 图像智能字符识别技术
公司有需求啊,所以就得研究哈,最近公司需要读验证码,于是就研究起了图像识别,应该就是传说中的(OCR:光学字符识别OCR),下面把今天的收获整理一个给大家做个分享。本人程序用的tesseract,官方地址:https://code.google.com/p/tesseract-ocr/,不为别的,谁让它支持我们的天朝的文字呢~哈下载好程序后解压:大概可以看到这样一个目录,别见怪楼主里面一堆测试文件。...
View Articleeclipse 之debug的巅峰使用
1,在运行中改变参数的 值 以便观察往下的执行情况 public void testmy1(){ str = "12345-12134"; regex = "^\\d{5}$-^\\d{4}$|\\^d{5}&"; pat = Pattern.compile(regex); mat = pat.matcher(str); System.out.println(mat.find());...
View ArticleLinode 提昇規格,並提供 SSD 方案…
Linode宣佈了規格提昇 (記憶體與流量) 以及 SSD 方案:「 The New Linode Cloud: SSDs, Double RAM & much more」。那個 Linode 2G 的方案流量不是 2TB 而是 3TB,明顯是針對 DigitalOcean的同等級方案而設計的…不過既有的客戶並不是馬上就有得用,要再等一陣子:CPU...
View Articleredis集群(主从配置)
市面上太多kv的缓存,最常用的就属memcache了,但是memcache存在单点问题,不过小日本有复制版本,但是使用的人比较少,redis的出现让kv内存存储的想法成为现实。今天主要内容便是redis主从实现简单的集群,实际上redis的安装配置砸门ttlsa之前就有个文章,废话少说,进入正题吧 Redis简介...
View Articlejrebel 安装与使用
此文权属个人研究学习之用。资源皆来自网络。 1.安装插件: eclipse marketplace 搜索 jrebel 或help-> install new software, update site: http://www.zeroturnaround.com/update-site/2.安装完后,提示invalid license. 关闭eclipse, 下载这个文件,...
View Article编写高性能的Lua代码
前言Lua是一门以其性能著称的脚本语言,被广泛应用在很多方面,尤其是游戏。像《魔兽世界》的插件,手机游戏《大掌门》《神曲》《迷失之地》等用Lua来写游戏逻辑。所以大部分时候我们不需要去考虑性能问题。Knuth有句名言:“过早优化是万恶之源”。其意思就是过早优化是不必要的,会浪费大量时间,而且容易导致代码混乱。所以一个好的程序员在考虑优化性能前必须问自己两个问题:“我的程序真的需要优化吗?”。如果答案...
View ArticleApache OpenOffice下载量突破一亿次
Apache 软件基金会 宣布,开源办公软件 Apache OpenOffice 下载量突破了一亿次。OpenOffice 的前身是 StarDivision 的 StarOffice,Sun 在收购 StarDivision 后公开了 StarOffice 的源代码,创建了 OpenOffice.org,2009 年甲骨文收购 Sun 后拥有了 OpenOffice...
View Article[转]MirrorOp 介绍
MirrorOp发送端可以将自己的Android屏幕透过网路(WiFi/Ethernet)或是USB投射到装有MirrorOp收屏端的装置上,如电视,投影机,手机或是平板,让使用者能够轻鬆地与朋友分享自己手机上的内容或是在企业中进行简报与讯息交流,彻底实现"无线传屏","USB传屏","网路传屏"。安卓手机间使用,需安装:...
View Article移动广告追踪炙手可热 两大研究机构同时出手
腾讯科技李路 4 月 18 日编译移动端市场发展地风生水起,广告主自然不会放过这个推广机会,在这领域大把投钱。然而其效果几何,目前尚未有一个相对准确的测算工具。针对市场的需求,Nielsen 和 ComScore 两大市场研究机构准备推出新产品,填补这一空白。Nielsen 周四与 BrightRoll 和 TubeMogul...
View ArticleSpark入门级小玩 - RichardParker
·背景 随着周边吐槽hadoop的声音渐渐多起来之后,spark也逐渐进入了大家的视野。之前,笔者有粗略的写过一篇spark的安装和性能比较[...
View ArticlePOI读写Word docx文件
使用POI读写word docx文件目录1 读docx文件1.1 通过XWPFWordExtractor读1.2 通过XWPFDocument读2 写docx文件2.1 直接通过XWPFDocument生成2.2 以docx文件作为模板 POI在读写word...
View ArticleSSD和HDD之间的价格差短时间不会消失
固态硬盘(SSD)过去几年价格一直快速下降,但下跌趋势正日益放缓,一系列问题导致SSD和机械硬盘(HDD)之间的价格差距不可能会很快消失,SSD不会在短时间内取代HDD成为企业的主储存设备。SSD的价格从2005年和2006年的3美元/GB跌至了2012年的0.67美元/GB,但与HDD的0.09美元/GB相比仍然相去甚远。根据SSD价格的历史下降速度计算,到2020年它的价格约为0.15美元/GB...
View ArticleNode.js的学习--使用cheerio抓取网页数据 - 疯狂的原始人
打算要写一个公开课网站,缺少数据,就决定去网易公开课去抓取一些数据。前一阵子看过一段时间的Node.js,而且Node.js也比较适合做这个事情,就打算用Node.js去抓取数据。关键是抓取到网页之后如何获取到想要的数据呢?然后就发现了cheerio,用来解析html非常方便,就像在浏览器中使用jquery一样。使用如下命令安装cheerio npm install...
View Article如何构建高性能web站点之:分布式缓存
一、数据库前段的缓冲区要明白数据库前段的缓冲区,首先要明白什么是文件系统内核缓冲区(Buffer Area):它位于物理内存的内核地址空间,除了使用O_DIRECT标记打开的文件以外,所有对磁盘的读写操作,都需要经过它,所以,可以把它看作磁盘的前段设备。这块内核缓冲区也称为:页高速缓存(Page...
View ArticleNginx优化指南+LINUX内核优化+linux连接数优化+nginx连接数优化
Most setup guides for Nginx tell you the basics - apt-get a package, modify a few lines here and there, and you’ve got a web server! And, in most cases, a vanilla nginx install will work just fine for...
View Article产品经理必知:UED设计流程与原则
UED设计流程在各个公司之间可能存在不同,国内的设计师在知乎社区上讨论了各自公司(包括腾讯、百度等)的UED设计原则、流程等,其中的经验值得读者借鉴。来自腾讯的交互设计师eviliu强调设计流程主要考虑两方面的问题:一是设计原则从何而来,二是如何配合设计的上下游团队。就设计原则来说,从四个方面进行了阐述:>始终将用户体验放在第一位——在设计流程中将用户体验融入其中,将其贯穿于设计的始末,使用户...
View Article【转载】两个美国人对中国人的评价,值得每个中国人反思! 文/阿林
两个美国人对中国人的评价,值得每个中国人反思! 希拉里在美国哈佛大学演讲,对将来的中国进行预测: 20年后,中国将成为全球最穷国家。她给出的依据是: 1、从申请移民的情况看,中国90%的高官家属和80%的富豪已申请移民,或有移民意愿。一个国家的统治阶层和既得利益阶层为什么对自己的国家失去信心?很令人费解!...
View Article如何利用互联网工具深入调研你仰慕已久的网站
网上有很多优秀、火爆的网站,相信大家一定会想知道这些网站的发展过程是怎样的?他的用户增长速度是怎样的?现在的PV是多少?我们能够看到网站现在的样子,但是相信你也想知道它以前设计的样子。尤其是奋斗中的站长们,你们应该对竞争对手或者行业前辈的推广方法和发展过程非常感兴趣。在你想要设计一个和其他人不一样的UI或者功能的时候,或许其他人早就在半年前已经尝试过,后来砍掉或者修改掉了。获得这些机密信息的最简单的...
View Article