在线化学结构式图片生成服务

利用一些网站提供的资源,可以在线生成结构式图片。其中比较突出的是DayLight提供的服务,在另外一篇 结构式图片生成服务, DayLight SMI2GIF 中做过详细介绍。DayLight的服务传入的结构式参数是SMILES,而且有很丰富的参数以调节输出效果。

NIST是美国国家标准与技术局(National Institute of Standards and Technology),NIST WebBook 是老牌的免费化合物信息数据库,提供丰富的化合物物理、化学性质数据。其化合物的编码方式,其实是CAS号码。把CAS号码转换成数字,就可以很容易得到结构式图片的地址了。

http://webbook.nist.gov/cgi/cbook.cgi?Struct=C490119

NIST WebBook的数据量并不是很大,只有几万条记录。不知道是不是因为太老的原因(05年就没再更新过),其中还有错误数据。至少到这篇发布的时候,上面的例子仍就是一个错误结构。我写Email报告了这个问题,不知道啥时候能修正。

NLM是(National Library of Medicine) 它提供的ChemIDPlus数据库 也是用CAS号码进行编码的。数据量要比NIST大很多,结构式输出的质量也更好。

http://chem.sis.nlm.nih.gov/chemidplus/RenderImage?maxscale=30&width=200&height=200&superlistid=000490119

对于化合物的标记,SMILES是公开的标准,直观还原结构式信息,值得应用;CAS不公开不免费,但也成为了既成的行业标准。现在能与CAS相提并论的,我想就是NCBI的PubChem 数据库了。NCBI是美国国立生物技术信息中心(The National Center for Biotechnology Information。在在线数据库的范畴内来说,PubChem的Compound ID(cid)基本上是必被引用的。所以也勉强将它用cid作结构参数的图片生成接口纳入进来。这个接口背后也有很多参数用以调节输出。

http://pubchem.ncbi.nlm.nih.gov/image/imagefly.cgi?cid=10273&width=400&height=400

有一篇很好的文章,Thirty-Two Free Chemstry Databases(32个免费化学数据库) ,仔细读过的话也许还会有更多的发现。

Firefox加载Java Applet后死翘的问题

现象就是加载了带Java Applet的网页后,直接死翘或者在关闭页面的时候死翘,整个Firefox失去响应,只能强制结束进程。
真好吃: JVM卡死firefox提出了正解。

我的firefox有时候不能正常现实applet
反映就是卡死firefox
但是有一个奇怪的现象就是 如果运行本地的网页applet后
在不关闭firefox的前提下 去看含有applet的网页没有任何问题

我百思不得其解 最后分析出了一个大概的原因
jvm大概无法获取firefox的代理服务器设置
所以就卡死掉了

我在java 控制面板中代理服务器设置选择直接连接就解决问题了

如图设置,搞定
JVM connection setting

结构式图片生成服务, DayLight SMI2GIF

SMILES的发明者,DayLight公司提供了一个非常实用的Web Service工具,可以在线通过化合物的SMILES编码,生成它的结构式图片。这个工具就是SMI2GIF 。它是基于DayLight公司的产品”HTTP Toolkit“建立的。我们可以购买这个产品自己建立Web Service,也可以直接在线使用DayLight提供的服务。

下面的图片是一个最简单的在线应用。

图片的HTML代码是

        <img src="http://www.daylight.com/dayhttp/smi2gif?smiles=Oc1ccccc1"></img>
    

DayLight给出了一个参考文档,对这个接口的调用参数和功能,讲述得非常详细。下面就把简单的,我也懂的参数作一点举例介绍。

图片的高度和宽度,线条的粗细,输出的格式(PNG/GIF)

        http://www.daylight.com/dayhttp/smi2gif?width=100&height=100&smiles=O%3DC1CCCCC1&Linewidth=thick&output=PNG

色调搭配

提供了几种基本色调


COB
- color on black

COW
- color on white

COP
- color on paper

BOW
- black on white

BOP
- black on paper

WOB
- white on black

WOP
- white on paper

        http://www.daylight.com/dayhttp/smi2gif?smiles=O%3DC1CCCCC1&colormode=COW
    

对原子单独指定颜色

        http://www.daylight.com/dayhttp/smi2gif?numcolors=10&tdt=%24SMI%3COCCCCCCCCCC%3EALAB%3C0.0%2C.1%2C.2%2C.3%2C.4%2C.5%2C.6%2C.7%2C.8%2C.9%2C1.0%3E%7C
    

是否显示手性结构

        http://www.daylight.com/dayhttp/smi2gif?hide_chi_h=false&smiles=C[C%40%40H](N)C(%3DO)O
    

突出显示子结构

这样的功能一般都用在子结构检索之后的结果输出中。

        http://www.daylight.com/dayhttp/smi2gif?smiles=O%3DC1CCCCC1&highlight=O%3DC
    

URL编码

对查询URL中的SMILES字符串,应该用URL-Encode(RFC1738)进行编码。同时,SMI2GIF也支持省略掉百分号的简洁编码方式,比如 (O=C1CCCCC1)可直接表示成 4f3d4331434343434331

参数缩写

SMI2GIF的各个参数,都可以按照下面的映射进行缩写

Option Abbreviation
colormode c
fromto f
height he
hide_chi_h hi
hlen_pct hl
hydrogens hy
numcolors linew
linewidth n
old_style ol
orient or
output ou
reaction r
scale sca
schematic sch
smiles smil
smirks smir
tdt t
width w
xsmiles x

windows search 4.0预览版发布

Windows Search 4.0 Preview

windows search以前叫msn desktop。自打vista,微软就很重视桌面搜索了。与之对应的更著名的桌面搜索软件是google desktop,实际上后者也更强大,更开放(windows search也是通过ifilter开放的)。

其实windows内置的搜索,很早很早以前就有了,叫index service。index service/ msn desktop/ vista/ windows search这一系列产品,貌似都是同样的技术基础。但是一个产品定位总是不准,形象一直变化,就显得不那么高档。这一点上来说,微软的市场能力还真不一定就比google强。

着两种桌面搜索产品以前都用过。说不上什么确切的理由,但是比较自然地用windows search替换了GDS。windows search在使用上,的确更贴近普通用户。贴两张图吧。

desktop-search-windows.png
desktop-search-google.png

谷歌拼音输入法的化学专业词典

简介

可以用于谷歌输入法的词典文件,包含大量中文化学词汇,多为化合物名称。词库容量很大,有15976条化合物名称中文词汇;包括各种多音字拼写(也包括拼错的)共有拼音条目6万余条。比较搜狗拼音化学词汇大全【官方推荐】的一千多条的量要大多了。

google pinyin dict for chemist

作者 zh.charlie@gmail.com

使用方法

在谷歌拼音输入法的“属性设置”中导入

googlepinyinimport.png

数据和制作方法

化合物中文名称,从Chemblink.com网站上采样获得。

词汇提取程序使用Python编写。其中,从unicode字符串中提取汉字的正则表达式:

ur'([\u4e00-\u9fa5]+)'

汉字到拼音的转换程序,使用了roy在水木上贴的python代码和数据库

谷歌拼音输入法的词典格式和分析方法,在前一篇中有所介绍。

使用授权

随便用。随意转载、修改、使用,不必注明原作者。对词典的正确性、全面性作者无法保证和负责。


下载

google.pinyin.dict.for.chemists.zip

搭建了一个免费电子书下载搜索引擎

用Google自定义搜索搭建了一个免费电子书下载搜索,把以前常用的几个站点都放上去了。包括csdn下载频道这类非法电子书交换市场;也包括RapidShare这样的文件存储网站;还有一些大大小小的电子书共享网站。以后随时把自己用到的类似站点这样做垂直分类。

实际上早有人开始做这样的事了,而且更敬业一些。对自定义搜索引擎中搜索一下就可以找到他们了。

coopfreeebookdownload.png

SQL Server开源免费工具

Buck Woody 在MSDN Blog上列出了他最中意的开源 SQL Server 工具软件,这些开源软件都是在微软的开源软件平台,CodePlex 上进行维护的。他介绍了五个软件。

  1. Web版维护工具,SQLWebTools,http://www.codeplex.com/SQLWebTools。基于Web的SQL Server维护工具,可以用在远程主机上,代替企业管理器(企业管理器不是免费的)。还有一个Php版的工具phpMSAdmin,与之类似。
  2. DBA经常要做的一件事,就是用脚本备份整个数据库结构。ScriptDB就是这样一个工具,http://www.codeplex.com/ScriptDB。这是一个用C#写成的命令行工具,可以将数据库结构以企业管理器中的层次结构备份到文件夹中。可以定期对数据库结构及其中的程序(存储过程、视图、函数、触发器等)做这样的快照,之后进行文本比较或者添加到版本管理工具中。
  3. 数据库比较工具, DbDiff, http://www.codeplex.com/DbDiff。这种工具是非常有用的工具,可是在这之前我还没有找到过真正免费的。DbDiff只能比较数据库结构,不能比较数据。RedGate提供一系列的工具很强大,价格也公道。

  4. SQL Server Express 管理工具,ExpressMaint, http://www.codeplex.com/ExpressMaint。SQL Server Express是免费的数据库服务器,有了各类辅助工具,就很值得一用。

  5. Simple SQL Server Dependencies, http://www.codeplex.com/SSSDependencies, 顾名思义,就是对SQL Server中的Object之间的关系进行分析的工具。

另外,在Del.icio.us中用sqlserver opensource tool这三个Tag ,可以发现下面的这些工具。Enjoy yourself.

  1. SqlDump - MS SQL database backup program

    SqlDump is a program to backup a Microsoft SQL Server database as a text file. SqlDump generates SQL statements for tables, indexes, user-defined types, views, procedures, etc and also the table data.

  2. SourceForge.net: DB Designer Fork

    DB Designer Fork is a fork of the fabFORCE DBDesigner 4. DBDesigner is a visual database design system that integrates entity relationship design and database creation. DB Designer Fork generates SQL scripts for Oracle, SQL Server, MySQL and FireBird.

  3. SQuirreL SQL Client Home Page

    SQuirreL SQL Client is a graphical Java program that will allow you to view the structure of a JDBC compliant database, browse the data in tables, issue SQL commands etc, see Introduction. The minimum version of Java supported is 1.5.x as of SQuirreL vers

  4. Query Express

    “Simple Query Analyzer look-alike, especially useful for MSDE and SQL Express. Also connects to Oracle and other OLE-DB compliant databases. Packaged as a single 100KB executable, i.e. more than 300 times smaller than SQL Server Management Studio.”

  5. Data Dictionary Creator

    Data Dictionary Creator (DDC) is a simple application which helps you document SQL Server databases. It stores all the information in Extended Properties, so it’s easier to keep the documentation in sync with the database as it changes.

  6. Data Modelling Tools

  7. SQL Manager: Database Management Tools for MySQL, SQL Server, PostgreSQL, InterBase, Firebird

    Database maintenance tools for popular relational database servers.

  8. |QueryCommander the sql editor|

    QueryCommander is a free sql editor wrapped in a Visual Studio type of environment. QueryCommander supports:

  9. SqlBI.eu

  10. SqlBulkTool 1.0

    SqlBulkTool is a command line utility that is used to quickly create a mirror of a database. It reads its configuration from an XML file containing source and destination command strings and a list of all the tables to mirror and then handles the work of

  11. TSQLUnit testing framework

  12. SchemaSpy

    Graphical Database Schema Metadata Browser

一些厂商提供的数据仓库工具

200811

19:48

做一个最浅度的分析。孰优孰劣从软件的外观上可知一二。图都来自于厂商在线手册。

公 司 名 称

ETL工具

数据仓库管理工具

OLAP工具

数据挖掘工具

报 表 工 具

IBM

Warehouse Manager

Visual Warehouse

OLAP Server

Intelligent

Miner

Insight&Qucik view

Oracle

Oracle ETL Server

Enterprise Manager

Express Server

Darwin

Express Analyser

Sybase

Replication Server PowerStage

Warehouse Studio

Warehouse Analyzer

SAS

SPSS

InfoMaker

CA

InfoPump

PLATINUM ERWin

PLATINUM InfoPump

DecisionBase InfoBeacon

Neugent

Aion

Forest&Trees

InfoReports

SAS

第三方

Warehouse Administrator

SAS MDDB

Enterprise Miner

EIS ER

Microsoft

SSIS

SQL Server

SSAS

SSAS

SSRS

Pasted from <http://book.csdn.net/bookfiles/537/10053718137.shtml>

IBM DB2 Business Intelligence

Pasted from <http://publib.boulder.ibm.com/infocenter/db2v7luw/topic/com.ibm.db2v7.doc/db2tu/db2tuo10.htm>

Oracle Warehouse Builder

Pasted from <http://download.oracle.com/docs/cd/B28359_01/owb.111/b31278/concept_data_modeling.htm>

Sybase WarehouseArchitect

Pasted from <http://manuals.sybase.com/onlinebooks/group-wa/wag0320e/waug/@Generic__BookTextView/28735;pt=30045>

Dimension Structure tab of Dimension Designer.

Pasted from <http://msdn2.microsoft.com/en-us/library/ms169952.aspx>

谷歌输入法词典 与 我说话的习惯

新版谷歌输入法(1.0.23.40),图标变成了新的样式谷歌输入法。在翻查设置看看有没有新功能的时候,发现了一个以前没用过的旧功能,就是“导出用户词典”。

这个词点是很有意义的。因为它是可以在各地通过Google帐户自动同步的,所以基本上可以看出自己说话都习惯讲哪些词。

导出后,是一个扩展名为.dic的文本文件。每行用TAB分割为三列。用Excel可以导入处理,不过要先用Notepad另存为Unicode,否则会是乱码。Google的spreedsheets只支持逗号分隔的文件,所以改名成.cvs并用spreedsheets导入没成功。

这个表格第一列是词,第二列(估计)是词频,第三列是这个词的拼音拼法。按照词频倒排序可以看出最常说什么话,但是往往排在最前面的都是一个字的词。做个假设

长词汇使用的可能性低,但是却往往更能反映习惯。词长与词频的乘积可以作为“习惯的衡量指标”。

这样的话,在Excel表里处理一下,我的前二十位词汇如下,中规中矩,呵呵,估计老板看了会高兴。

的
产品
谢谢
数据
系统
问题
可以
这个
工作
客户
项目
信息
如果
现在
在
我们
没有
是
销售
进行

放在U盘上,可以在Windows下运行的Ubuntu

原文是How to put Ubuntu Linux on a flash drive and run it under Windows。说了几个步骤,但是是按其步骤操作,恐怕不容易成功。

首先那个著名的HP-USB format tool并不是必须的,SP27213.exe早就在HP网站上下架了。网上倒是可以找到。只需要把U盘格式化成FAT就行了。

不需要2G的U盘,700M的Ubuntu ISO,200M的硬盘分区,加上qemu, kqemu啥的够尝尝鲜了。

qemu是个免费虚拟机,可以portable运行,不需要安装,所以被应用在这里。kqemu是优化这个虚拟机性能的软件。

原文里说的ubuntu.bat实际是不存在的。照葫芦画瓢,可以这样写:

qemu-img create -f qcow hdd.img 100M
qemu.exe -L . -m 512 -hda hdd.img -cdrom ubuntu.iso -boot d

第一行创建一个100M的虚拟硬盘。第二行启动虚拟机,使用第一行创建出的虚拟硬盘做硬盘,使用ubuntu的iso文件模拟光驱。从光驱启动。于是就可以运行live CD了。

在Windows下启动kqemu,也不是自动的,按照文档上说的,要

Right click on `kqemu.inf' in Explorer and choose Install.
In order to start kqemu, you must do:
net start kqemu

qemu并不怎么好用。在u盘上跑起来速度很慢,恐怕难以忍受。

vmware也有免费的player。

原文出处是一家卖这个系统的公司,PenLinux.com sells usb flash drives with Ubuntu Linux pre-installed.

这套方案可以用来运行更轻便的Linux发行版。在一小块U盘上,不但保存着自己的工作数据,还有操作系统,在随处可见的Windows平台上可以开始与众不同的工作,的确是很有意思的事情。

Next Page »

Random posts

  • 推荐8box的音乐专题:在忧伤的旋律中的情人节
  • 9月9日购书单
  • 秃瓢
  • Hello world!
  • VOIP穿越防火墙笔记总结