experience

Python中的多进程队列

Written by  on September 21, 2016

在Python中进程间共享数据比较常用的方法就是多进程队列multiprocessesing.queues.Queue,官方文档在这里是这么说的: The Queue class is a near clone of Queue.Queue; Queues are thread and process safe.

[Read more...]

用Python备份WordPress数据至Google Drive

Written by  on July 28, 2016

前段时间因为Google Photos照片传太多把Google Drive空间用完了,就买了三刀一个月的Google会员,然后就发现100G空间似乎一时半会儿还用不完,正好之前一直想着给博客服务器来个自动备份脚本,所以就先把坑填了。

[Read more...]

git通过config指定ssh密钥

Written by  on July 9, 2016

之前博客里面有记载过通过脚本的方式指定git的ssh密钥,略为复杂,后来从同事那里知道了一种更简单直接的方法。

[Read more...]

张家界

Written by  on June 21, 2016

算是按部就班地来了一次毕业旅行吧。 起初是决定去凤凰的,结果当时在长沙和小伙伴们一起向过来人打听,都说张家界比凤凰好玩,就临时改途买了火车票去张家界。

[Read more...]

代码与猫

Written by  on May 14, 2016

此生我最痴迷得无法自拔的有两样,一个是代码,一个是猫,即使我现在并不是一个代码高手,也没有养猫。 读过一点村上春树的《猫》,里面对猫的爱之表达真实毫无保留,毫无保留到令人发指,没错我说的就是里面的虐猫描写,我能够理解他们日本人这种习惯将任何情怀发挥到极致,但是对于同样爱猫的我来说,着实不能接受,所以那书我看了一半就丢掉了(只是从我的Kindle Library删除 :p)。不过书中倒是有一个有趣的事实,那就是猫只会在人类面前发出「喵」的叫声,仔细一想还真的是,说是永远不可能被驯服的喵君,无形之中也似乎已为人类所征服,当然这也可能只是我们这些无知人类的意淫。

[Read more...]

使用scikit-learn进行KMeans文本聚类

Written by  on April 28, 2016

K-Means 算法简介 中文名字叫做K-均值算法,算法的目的是将n个向量分别归属到K个中心点里面去。算法首先会随机选择K个中心向量,然后通过迭代计算以及重新选择K个中心向量,使得n个向量各自被分配到距离最近的K中心点,并且所有向量距离各自中心点的和最小。

[Read more...]

Pypy使用Pymongo

Written by  on April 8, 2016

据说  Pypy的速度比 CPython 速度要快的多,所以准备换成Pypy试一试,但之前在使用CPython的时候使用pip安装的第三方库(比如pymongo直接给Pypy用的话会报ImortError,这个使用似乎要通过Pypy重新安装一下pip,在Ubuntu下通过apt-get安装Pypy过后执行下列操作:

[Read more...]

MongoDB插入对象过后原对象被更改

Written by  on April 6, 2016

今天发现了MongoDB中一个很奇怪的设计(或者说是坑。。。) 我在向MongoDB中插入一个对象的时候,不光数据库中新建的Document会自动生成一个Object ID,这个Object ID还会自动插入到原对象里面去,如下所示:

[Read more...]

git指定ssh密钥文件

Written by  on March 29, 2016

在ssh到服务器上的时候可以可以通过-i参数来指定登录密钥,有的时候git也会有这种需求,但是git本身没有自带-i参数,Google一番过后发现可以用脚本来解决。

[Read more...]

Python2.7处理中文utf8 json数据

Written by  on March 28, 2016

在Python 2.7里面字符编码似乎是一个很令人烦躁的问题,最近在处理抓取的数据时候碰到了一些问题,在这里记录一下:

[Read more...]