"The European Molecular Biology Open Software Suite"
About Стабильный и качественный Начат в 2000 году, авторы – Peter Rice и Alan Bleasby (UK). Open source, идет под GNU General Public License, принимаются приложения сторонних разработчиков; содержит подпакет EMBASSY, которая идет под какой-то чуть более строгой лицензией; EMBASSY содержит, прежде всего Phylip – пакет для работы с филогенетическими деревьями. Кроссплатформенный (то есть под WinXP тоже должен работать). Написан на чистых C (но голова авторов думала на C++) + немного графики все-таки на плюсах.
Как познавать EMBOSS? wossname или apropos поиск по ключевому слову: wossname Needleman Finds programs by keywords in their short description SEARCH FOR 'NEEDLEMAN' needle Needleman-Wunsch global alignment of two sequences stretcher Needleman-Wunsch rapid global alignment of two sequences Нет manа, зато есть tfm the following (есть альтернативные транскрипции ;) manual – прилагающееся руководство. -help список параметров программы
Top 5 любимых программ seqret – возвращает последовательность в указанном формате entret – возвращает запись банка данных infoseq – выдает информацию о последовательности noreturn – режет carriage returnы (\r). yank/union – нарезает последовательности в list file и объединяет их
Параметры В выдаче –help значение параметра по умолчанию стоит в квадратных скобках (например, [Y]) Standard (Mandatory) – обязательные Additional (Optional) qualifiers - дополнительные Advanced (Unprompted) qualifiers – то, что не спросит, если не задать General – общие для всех программ EMBOSS (-help и т.п).
USA = uniform sequence address "file" "format::file" "format::file:entry" "dbname:entry" Where "format" is the database format of a file ("file") you have provided and "entry" is the database entry code. Alternatively an entry can be retrieved from an installed database of format "dnmame". "listfile" is the name a file which itself contains a list of file names. The "::" and ":" syntax is to allow, for example, "embl" and "pir" to be both database names and sequence formats. seqret msf::sw:pax6_human[35:45]
Wildcards Как и много где «*» означает любой набор символов, «?» - один любой символ. Так, sw:adha_* означает любые последовательноти, ID которых в Swiss-prot начинается с adha_. Неприятность в том, что их придется маскировать в командной строке либо бэкслэшем (\), либо в кавычках (), потому что у bash тоже есть эти wildcards и он примет их на свой счет, если этого не сделать.
Базы данных в EMBOSS Что-то содержит локально, что-то вытаскивает из сети. showdb – команда, позволяющая посмотреть, какие базы данных установлены на вашем компьютере (в данном случае, на kodomo). Никакой магии - чтобы посмотреть, как происходит обращение к базе данных, можно почитать файл emboss.default в /usr/share/EMBOSS. Там описано, каким методом к какой базе делается обращение. Кроме того, можно создать на свою голову ~/.embossrc в домашней директории и переопределить эти настройки.