Blog完成一次重新整理与分类

分类是个烧脑活。不同意?去看看自己的电脑桌面或者下载目录就明白了。关于如何给硬盘上的文件分类的坑等我把一百多万个文件整理完之后再来写,这次只填这个280号坑,这坑有一年多了的说。

以前的“四大基本原则”是高中时对现实生活做的分类,Study、Computer、Piano、GMSJ这四个。博客长久以来沿用这个分类法,得到的最明显的效果就是“电脑”分类占了80%,所以对于一个主要定位为技术博客而言,等于没分。

最容易想到的分类方法是依据文章内容分类,类似于图书馆分类法。对内容的归纳操作其实就是打关键词tag,昨天花了不少时间将所有的文章重新打tag,最后基本上形成这样的tag cloud。

这样马上就发现了新的问题:第一是这个tag cloud并不容易进一步归纳,第二是有些文章打了两个tag。对于树状分类,如果出现重叠,那么说明分类法并不合适,或者是分得太细。所以还需要思考。

分类与标签的本质区别是分类是出现在文章写作前,任何文章都应当能够归类且唯一归类到一个类别中,如果觉得可以归到两类中,则说明算法不够好。标签是发生在文章写作后,对文章内容的关键词描述。

以前的四个分类事实上是算法合理的——和计算机相关的扔到Computer,和音乐相关的扔到Piano,和日记相关的扔到GMSJ,剩下的扔到Study。之所以不合适是因为Computer里扔得太多,所以应当可以进一步分类。

对Computer中内容的审查发现,有两类非常不同的文章,一类是技术笔记,记录开发与折腾的过程或成果,别人来了可以学走点东西;一类是应用笔记,例如软件应用、测评,没有实质性的技术性内容。故决定将“有实质性技术内容”归到一类,将没有技术内容的移除,然后改名为现在的Tech。

Piano很容易区分,可以不变,改名为Music。

GMSJ原本是用来写日记的,但是由于考虑到隐私安全,这里面的绝大部分文章现在都是Private权限,所以打算将Study中关于现实生活的一些杂文分到这里,改名为Life。

Study本来就是个比较杂乱的分类,非技术、音乐的东西都扔在了这里。故基本当作未分类使,改名为Blog,并将前面Computer中非实质性技术的文章扔进来。

这样调整之后的四个分类在文章数目比例上就科学多了,并且算法非常清晰。且Tech中只发表个人原创的折腾,非常适合订阅阅读和统计开发成就。

欢迎读者提出更烧脑但更有效率的意见与建议。

Leave a Reply

Your email address will not be published. Required fields are marked *