分类目录:电脑技术

SQLite 扩展应用

SQLite 根据作者的说法,它不是要跟 PostgreSQL/Oracle/MSSQL/MySQL 比,而是要取代 fopen(),让应用开发者不用自己考虑文件格式的解析和序列化。我们来看看 SQLite 中比较少注意到的功能。

PRAGMA

  • PRAGMA journal_mode=WAL。本地数据库可以用 WAL 模式加快读写速度,减少多进程冲突。
  • PRAGMA cache_size=-kibibytes,加大你的缓存。
  • PRAGMA application_idPRAGMA user_version,让程序给自己的数据库标上识别码和版本号。

权限机制

SQLite 有一个很简单的权限系统,能对 SQL 虚拟机的操作指令设置回调 [1],来判断是否允许操作。拿 Python 举例 [2],例如我们要仅允许只读操作。

import sqlite3

SQLITE_FUNCTION = 31

def …

为什么不用 LaTeX

8102 年了,为什么还要用 LaTeX 呢?LaTeX 没有:

  • 良好的设计。混乱的宏定义名称、包名称、语法,读不懂的错误信息。你猜不出你要用的命令到底叫什么、在哪个包,也没有命名空间的约定。
  • 文档。它唯一的官方文档是一本书,没有电子版,也没有多少能用的索引,有些命令还没有提到。常见问题分散在各大论坛、问答网站,而不是加进官方文档。每个包的文档不统一,还得用难用的 PDF 搜索功能。
  • 更新。没有新增和删减功能,都是靠包来凑。
  • 国际化支持。别跟我说 Xe/Lua/PdfLaTeX 之类的扩展实现,LaTeX 设计上就是没有的,也常常会遇到外部扩展不支持国际化的问题。它是在 Unicode 标准建立之前设计的,却从来没有官方更新支持国际化和 Unicode。除了拉丁文字,其他文字的特有排版样式,像是中文竖排,也是没有的。
  • 排版样式。你就只见到过那几种排版 …

基于 Moses 的文言文统计机器翻译系统

Note

这是一份参加学校办的科技竞赛写的论文。既然没得奖,就直接放出来供大家参考吧。本文内容参见之前发布的 《文言文机器翻译》。点击使用 在线演示

为了更清楚地列出所采用的资源和工具,在发布时另外标注了链接和符号角标。

摘要:本项目制作了一种文言文机器翻译系统,使用了基于词组的统计翻译模型。通过收集整理大量平行语料、训练针对文言文的分词系统并应用统计机器翻译中的先进技术,在控制了模型大小和内存占用的情况下,使本系统的翻译结果质量超过了现有系统的水平。本系统拥有较为友好的用户交互界面,能根据文本特征自动确定翻译方向并在结果中显示原文和译文中词语的对应关系,最终本系统可以为用户提供了一个新的文言文辅助阅读方法。

关键词:文言文,统计机器翻译,自然语言处理

A statistical machine translation system for Classical Chinese based on Moses

Abstract: This project presents a statistical machine translation system that can translate text between Classical …