Contig_ID | Contig_def | CRISPR array number | Contig Signature genes | Self targeting spacer number | Target MGE spacer number | Prophage number | Anti-CRISPR protein number |
---|---|---|---|---|---|---|---|
NZ_CP049868 | Pedobacter sp. HDW13 chromosome, complete genome | 3 crisprs | c2c10_CAS-V-U3,cas3,WYL,DinG,csa3,cas14j,DEDDh | 0 | 0 | 2 | 0 |
CRISPR_ID | CRISPR_location | CRISPR_type | Repeat_type | Spacer_info | Cas_protein_info | CRISPR-Cas_info | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
NZ_CP049868_1 | 3778943-3779042 | Orphan |
NA
Consensus repeat of NZ_CP049868_1
|
1 spacers
spacers of NZ_CP049868_1
>1.1|3778977|32|NZ_CP049868|CRISPRCasFinder AATCAGGCAGGTAGTGATATACAGGTGATGGG |
CRISPR arrays and Neighbor proteins around NZ_CP049868_1
The CRISPR arrays of NZ_CP049868_1 >merge|NZ_CP049868|1|3778943-3779042|CRISPRCasFinder AACTACATTGATTAGAGGCTTCGGTGTTGAATTTAATCAGGCAGGTAGTGATATACAGGTGATGGGAACTACATTGATTAGAGGCTTCGGTGTAGAATTT >NZ_CP049868|1|1|3778943-3779042|CRISPRCasFinder AACTACATTGATTAGAGGCTTCGGTGTTGAATTT AATCAGGCAGGTAGTGATATACAGGTGATGGG AACTACATTGATTAGAGGCTTCGGTGTAGAATTT
>NZ_CP049868.1|WP_166209629.1|3776875_3778585_+|hypothetical-protein MGQATYNWSIRPGVKNRYGIIIPPSEDWERPGDNHAYFATWGSDETGNGSRMYPFKTPNSNYYGILASGVYRGLQGFYCYADGNVIFDNEIAGSDINVSFCFGAKIRSSYSVSCNESRYCEFKAKANIVNNQAYYQQYNTYETGFSDTTKIFLFARRYELALPLSGNNTFVNSRVLISPDQHNHVLNNGYFSIFDNCEIEFNSLIPRLDYCLFNNCKFRMAYVEGEQFQEFDSIDDLTTWLKSKMDGAELLGWENCAFGDPKFNNPEIGDYTLAFDSPAKNMHYNGTFIGAKPIAVPLKITDNAEESGLDLSTAINLTIAPNTAKLTDRNLAASIESKPIVNLTGRRILSLPTFGYNADRNGEYIDSTPDLSNVPTQAGEILQDGTPYLVVGGSIVYNGEILPDDSRFVSLRENAGTFSTVVDAYVVEILEAPARENVECRFSNGTTTTISAGTSLEVGAWYHVEQAEITYNSATVAMGKCLKCVEGQVLFTGAGVLRKIFDLTSPWNYFEINQPLTSNNEGNFPTGAIMRGNGDRNFDRSKPFKIYHKFSQVRYTIQPNNLAPPAYEV >NZ_CP049868.1|WP_166209626.1|3776144_3776876_+|hypothetical-protein MGDIDFNGNRGMNVAMPEENGQIANKEYADQKEINAKNYADLVATDVLRYAGNWDASSGQYPTSGTGFGGEVRRGDSFEITVEGTIEDKEYEVGDQLRAKVDVPGQTLANWGSSQVNTQQATEVRIGIAKVATTAQAIDRLSDTEMMTPYKSGILIADVKKHYETQFNILSHTGYSILMIKAGQIDQLFSAGIIDLQMRVGAGDFQTPVFPMSYNAGDRVFFQFDFEDANEASGNIIILGRDN >NZ_CP049868.1|WP_166209623.1|3775776_3776124_+|hypothetical-protein MAKQTLNTIKNWFKTGLKPTQQQFWDSWDSFWHKDQVIPSSSVENLDARFDEKADDDAFQSHLTDDHAHNMDARLAHKVSVEQLEAESAARSNGDAYLQGQVDELFASPKVHLKW >NZ_CP049868.1|WP_166209620.1|3773609_3775631_+|hypothetical-protein MAKQTLNAIKNWFKTGLKPTQQQFWDTWDSFWHKDQVIPSSSIENLDARFDEKADVEFLAAHLTDPNAHGLENKVDKEAGKGLSANNFTDEEKTKLANLSDEDVSALTQRVGDLETQKADVENVYTKNELDIIVNGIALTPGPKGEPGIQGPKGEAGSDATVADADEIVKGKIKLAGDLSGTADAPIVHGLVGKQATLVSGTNIKTVNSISLLGSGDITLSVPVISVNSKIGAVLLDKVDMGLSNVDNTSDIDKPVSNLQAAALNSKLTGVIATDAETQITVGVIEDSKIVSRSKLFNWWAWIKTQALTLGNNLTLAVGTDTTAPLIIPSGTLTTIPQDGAIERDEGGVLWETRNGLRSTMAPPVKLIGSSIADKRTAIFSDSNSNFLGQNAGMQATEAGNSNFFGLSAGNQATEASYANFLGASAGDGATYASNSNFLGPSAGKSAINSSGSNFMGPAAGYNATTASNSNFFGQSAGMEAPSASSANFLGFFTGYKADNANNSNFFGYRAGNSATNASNANFLGQSAGFKATGAYHANFLGFNSGYDATDAAYSNLFGYKAGSTFTDNNLGSNNIIIGTNVSLPNATSNAINIGGILFAEETYSDTSGNPSIQPATNGKIGIGIVKPTSTLDINGDTEISKIGCGLILKSANGTRYRIIVTDEGTLSISSAG >NZ_CP049868.1|WP_166209617.1|3772944_3773610_+|hypothetical-protein MLPFKGGLLQTNIVVREDKQTRPFENGQVKEVFFTRYASFGTGTNAIPWTGLSRLKNLAAFKDLPTQISSAIDLDGADTLATSKAVKTLNDKINAQLPSGAIVIWSGAINVIPVGWALCDGQNGTPDLRDRFVLGAGSNYYVGQVGGEEKHALTIQEMPRHNFTTRFQLNIVDSSNYTSTLSYPGEGDRNEWREIGSNFLGNDIPHNNMPPYLAFAYIMKL >NZ_CP049868.1|WP_166209614.1|3772759_3772897_+|hypothetical-protein MNQINLQQAGGFPLETDTLDFMQTAYTALQAIAALGATIISFLVV >NZ_CP049868.1|WP_124561748.1|3772295_3772763_+|hypothetical-protein MWYKVDINKLVILLTPTFLRKPVFVAWLQALATPIATLHQQWYNKRLDNLYRLARNGQVCYLRATLNDAFDAGQRRIKIANGNKYQRKYIYTGTEQKHKYLGINYLLKVGDYADTGADFRVVIPQDFDLVNNKYQLEAMIDFYKLAGKRYNIEKE >NZ_CP049868.1|WP_166209611.1|3771183_3771465_+|hypothetical-protein MIKKALHNQSVLDFVLHHTGSIVAALDFSFDAAIAITDDLLVGNSYPVSGNLLADTDILNYYTSNNYTPATATLIDTDYGIGEMRILSTFIVR >NZ_CP049868.1|WP_124561801.1|3770899_3771187_+|cell-wall-anchor-protein MKQHVGELITAVIAAFGGWFFQRNKQKAELQANEIDNADKVLKYYREMVDDLGLRLKEAIVELNKTKEMVKELEEKVEALTDELKKHKKLNNTTS >NZ_CP049868.1|WP_124561751.1|3770669_3770888_+|hypothetical-protein MALNKNRLKSKIIAAFEAEQTEQEDYSASLDRIADKLAQCIIEEIKQLAITYNSGLLAPNGAVSGTFNATLS >NZ_CP049868.1|WP_166209634.1|3779427_3780849_+|hypothetical-protein MKRILIFAMLLVSLTTMAQTPPPLKVRSDAAFTQADTYLAALKGLQIPSGATNTLIGSGTRVNLFYNTVDKILYIHNGVDWRPAIEADLTQFYTKAETDLLLNKYILANVKQTANINLKGSVTSSNNDESLNTTISGGTVAFYGSAGGGQINLDGYNTSTPSGSIQITPVAVNISTDNNNSLEMTPSYIRMKSGGYENSIVRGLEPANVTNRLPSKDGTFATLEDLPDVSAYAKLYGGNAFSGAQDIDGLLKVKNINVSGKVTIPNGSITSLKSSADTIAFNGAKSNYIIRSVTTGSGPSATNNLIVQTSSAANPSVYSTVLTIDNGGITAPLVRISGGGGAPNGANAVSAAYLNSIYASGTYTPVLSARLNTASATAGTFHYTKVGNEITIYGNVTFMPFTANEDSAFKISLPMAYQSTFTTPEDLAGHGSLRLQGPVFIEGTVSDGTADVSTRPTLTTPSSCYISFTYTLK >NZ_CP049868.1|WP_166209637.1|3780886_3781312_+|hypothetical-protein MAKQTLNTIKNWFKTGLKPTQQQFWDTWDSFWHKDQVIPASSIENLDARFDEKADQEAFDALLQNVNNRFLAYPITVSGTEEYVLPWSGELKAIFGAYGNFSVWLNGSLEQVPITFTTGEDGKPKEYRFTLSGIDALILIK >NZ_CP049868.1|WP_166209640.1|3781319_3782456_+|hypothetical-protein MKKYLLIMLVAMALSATGQQTPTNKTRSNSDYSQVDNYLIGLKRLGIPTSVTDNLDAGGLPQNTVKIIYNTTLGRLRIYNPLTATWSDATQVDLSGYIQTNPSSAQLGSIVLNGDIALTNAHSMALYTGNDQTETGERAVWTNQYLKMINPLNSTFFDVTEGYLKHSGALEIKGQTDLYGHLWINQMDENTTGNDFDIAVRNRTNGNLDKVSFNNFPFLPLTGGNIKGHVSIGQGEATTGFISDPNGYTGFAFGVPNFTSLQMRYQPNALGRGLQIYDPYDPTNVMEGNAEWKKVLVEGDAIEASSGIPQNANININGNLRVNGVYLGADKLDLNNTGYIDNVTSIFVRGKQVKYLPLIWGRIALMLFRGILGMPISM >NZ_CP049868.1|WP_166209643.1|3782461_3783163_+|hypothetical-protein MSEGNYLKFFNGIVNEGERDYSELRTDNGGFQFTNDGVNLMDINYSGGSKFYNDLEVSGTLKATGGVDLGYSTFSGASDAGAWSFGRFGGSGKFRFDFANADVPFLGGLLVSEGIEAGNGISANNGETTGAYNIPLLAYGSNPMLGLRSLGYGKSAGIAYSAGGLDFWIKGNSNADLTSTGMRPLRIADDGKAEFYNDVEISDLTKGIIMKSPNGTRYRVTINDAGDFVKTAL >NZ_CP049868.1|WP_166209646.1|3783323_3785090_+|hypothetical-protein MKKYLLITLMAIALSATAQQTPTNKIRSSTDYSQVDNYLVALKRLGIPTSDSDNLDAGGLPQNTAKIIFNTTLGRLRVYNPIAGTWADATAVDMAGYYTKDQINNLLAGYLPLEGGALSGTLNITDGDYSVTALPSGYLAATNIKSRLKVNNTLAAMYFGYYPSEASANFEMSEELNGEKLLNIFTATSSDSPNGNGVQRGISWHSDDSGGIRITDNISHRGLTSGEVFTPVAAEDYVQKEYADKYWGKLANGDNFTSVQTGLITSILGKDQDGTAYLFNKHALRVFADLDYNLANDVEVLHKRGIETRKGSLFITNELDTNSASYLFAQDYNTGLGVQITSDGAINMNANKPTDTYGGLRMINSNVKGNVPIILSAGSNIGYINYTAQDYYPNANNSLELRNTSAGSDASIVIMLDAKGNSIRLDSAGVGIYRLERKLSFDSPLLTWENGRLKTVKDSVRLSPSALNSHLVGNAASFKISPPDGGSVVGARHEIGFNSWNASGTAYGIGGRVTSTDGNETNDLYLYNAGAERLIIEAGGKVKIPGVTEVANDVELTDPTKGVILKSPNGTRYRVTISDAGDFVKTAL >NZ_CP049868.1|WP_166209649.1|3785265_3785709_+|hypothetical-protein METDLSAAAQQTPTNKIRSSSDYSQVDNYLIALKCLGIPTSDTDSLDAPGLPQNTVKIIFNTSLGKLRIYNPASEIWTDAAVSDLADYLPLTGGTLTGPLYTPGLITKIFSTGHPSIPSTISSRFDGDLEGIPWLGILIMVKGHIKG >NZ_CP049868.1|WP_166209692.1|3785663_3787391_+|hypothetical-protein MAWDFDNGEGTHKRIEWITGFNEDRLTWDGIPLAYRNDLSNYVENTRAISDSYQSGGLALSTGKFGQLAVNTSEPAGNFHVRGTSFLDASSGSGGVQFYGVAEGNTGGINIGSAAENVAPSTNHYPLVQDVNTGLMKRSSKRGLYEGDVPVSPTGEFIYASPSTPQNASISLDNADIRISGNRFQGLYAPRVRVNTITDNDEFETPGLNITSSSSLAIAATTNMGISADKELFFNMGGTGSSILLGNYNIGGVERLALSGAKVELVETPPVATSNYSLLVRQDNGGELKTIDGNTFITKNTSTLPLNEGTNNLGFQKNSDDTFTANGYMNIKSVEGAPIASIGEAYNTFYGAMVLTDNPAYPGYNYFETQNAATGNRASLRSSGISFNTADGYLNLLPENGITGGHNVIFPTPLSNATVAYTSDLGFLPLTGGTISGDTTLEGGLYGHGPVDIWTDLNSARLSLSSSNATIKHTNPYGTGIAQVGAYSDGDHSQIQIIAGGAAGQRAINLESPDPEGRGITITEQVEGKGIQYVTDEDWANLNEQGLVPKKYVDNGFIKASPIEQQDAFINLEGG >NZ_CP049868.1|WP_166209695.1|3787648_3788272_+|hypothetical-protein MASIGAYAGDTYFKKTGGALTGNLTAPTIFPTNVKIINSGASGGNWVIDSSDDRFRFYNDVTGFGFELAGNTIRDVGGSNSKYLKESDNVTMAGLTVTGNVSIGSSGSLTRILSFGLEDNKPLIINSTYLGTAEHISFGSGDLRVNRGPGFRPVLLEGEATQIVDTVTSAPVPTGTGTKGQVIITGGYRYECISVNTWVRSAVETTW >NZ_CP049868.1|WP_166209698.1|3788271_3788571_+|hypothetical-protein MGNVLMIVMGGLGILIYNLFKAKEYIATNSFKPDIFVKENFAIWLWAFCVIVVASLILYIEPKANDVIKSLFGLDLANTKTGWLLFGIGLCGLFRNIKK >NZ_CP049868.1|WP_166209701.1|3788921_3793232_-|hypothetical-protein MGKENLISKVAVRVKTKGKYTGSGYVYLPSEESEWIYILTAKHCIYGKSFKAKPILKQILISRKKTESSEILSSYSLLDTDSIIVKNENSPDILALKLKRESLEGALGRFPVTYLSNYEYSELVGVFKGFPSLTNNEIPLTSGVEIISQDSEGANIHAQCNNDFSDENTSGDYNVEGYSGSGLCIEVNEKLFLIGLISKYSEAGRRFEASKIAPWMEEMIAGISIYSAKEERLVPYSLAFKQNKLAISALGPRYSPELNLKLKIGENFDTLALTSAKKEELQSNLNLLVEVYKGLLDSYSKLGKIEKSSFNRKKQTITFGYNTKGNLFTGKEIILKIGELIAYFSEAFNSSRLLELDWNEIRKKQRQSYDFGYGMYNIMYSLKSHFISTTVQFDDFDKAVSIFSREAERFIGAGQNFDKSLILIEGEPGSGKSHLLADIVTQRTEANKFTLLFLGQNFDGIHRPWDQILTQLGCSCELTSFLEIIDAKGRRINERVFIMIDAINEGEGIVSWRDGFRNFVDAIKPYQYIGLVISYRTTYRDFLFQATELQDIFIIRHSGFSGFEREAFISFAKHYELPIDSVPMLNKEFGNPLFLKLLCIGLKKDQANIRDFKKIGIDRIFQYYIEYVNREIGKHKEFGYAWHKINHVKRVLDFYTAKVVKIEDRNLDYEDAFLLTEDVVHRFLGKPGFLDKLIDENIFIDTIKYISRTDLRYQVTYAYDRLGDHLMAKELIASLPDPLNPNWHNQGMFKTILSDAQSNKLNQGLIDALSIQLPEQRQKEFWEVLPKEKQYAPAIVRAFYKSFSWRTAKVDSEKLEAFTQGYIETEGLSKNSFYDELIDMCLETDQPFNAFFLHGMLSDFSMADRDASWNIYLNDRYSDNQVGSEINVVKRLLKWAWKINDGIVYDEETVSLAVTALGWFLTSTNRTLRDISTKVLIHIFLTYQDHLLTWVEKFRMVNDPYVTQRVYAIAYGCAVKSSGEFLKSIADYIYKNFFETSEIIPDILARDYARSIIEYAVFRKVGIYNVREIRPPYNSSLESKLPANKEIALMEEKIGEGSAGKFNAGISILNSMITEKGRDGRMYGDFGRYVFQSALRPWKNANIQGLSNLAVKYIFDKYGYNIDKHGSFDREGGYNARIGKRLNERIGKKYQWIAFYEILARVADNDLSFSYNGPWEPYVRDIDPTFLENPEKAKIHLDFDVPDFAVWKDVPDPEWMSSHRYAFDPLSVISFKENNKPEIEWLALEANESYSSSNKSGAFDFSTPYKDFYYQLRSYLVAEDSYYSITNRLMTEDFMGRWMPEAHTVHELLNREFYWSPAFKDFIKENPEWRNIQVNRKYIGSVAPTAIDFLWEEEFDNSKDQVTNFHKPSMELFKALELEYGQEEGEFVNSKGEVVCFDPHVRHDSKSRLLVERKILEKQLKKKGLRIFWTVLGKGE |
You can click texts colored in the table to view more detailed information
CRISPR_ID | CRISPR_location | CRISPR_type | Repeat_type | Spacer_info | Cas_protein_info | CRISPR-Cas_info | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
NZ_CP049868_2 | 5267115-5267259 | Orphan |
NA
Consensus repeat of NZ_CP049868_2
|
1 spacers
spacers of NZ_CP049868_2
>2.1|5267159|57|NZ_CP049868|CRISPRCasFinder TGCGTCATGCTGAATTTCTGCCGGGTCGGATGTTTTAGCAACCGAAACCGATGCAGA |
CRISPR arrays and Neighbor proteins around NZ_CP049868_2
The CRISPR arrays of NZ_CP049868_2 >merge|NZ_CP049868|2|5267115-5267259|CRISPRCasFinder TAATCTGTAGCTAATCCACAACTCAAAACAATCGGCTTCGCCTGTGCGTCATGCTGAATTTCTGCCGGGTCGGATGTTTTAGCAACCGAAACCGATGCAGATAATCTGTAGCTAATCCACAACTCAAAACAATCGGCTTTGCCTG >NZ_CP049868|2|2|5267115-5267259|CRISPRCasFinder TAATCTGTAGCTAATCCACAACTCAAAACAATCGGCTTCGCCTG TGCGTCATGCTGAATTTCTGCCGGGTCGGATGTTTTAGCAACCGAAACCGATGCAGA TAATCTGTAGCTAATCCACAACTCAAAACAATCGGCTTTGCCTG
>NZ_CP049868.1|WP_166211377.1|5264257_5266948_+|DNA-ligase-D MSLQAYNQKRDFKKTTEPKAGISKDSKRLMFVVQKHDASRLHYDFRLEMGGVLKSWAVPKGPSLDPKIKHLAMMVEDHPFDYRNFEGIIPKGEYGGGTVIVWDQGWYETITDIKGKKAQENNLLKELAKGSVKVRLHGQKLNGEFALVKTKGMGEHAWLLIKHDDEYASKKDITKLDESVLSGKTLAVMEETSEKVWKSGKEQKLSTDKLAKVVKNKKDKDLDEGQDVALDVAKLLRNAPKLAMLKNVKPMLATLVDSAFDDEDWQYEVKWDGYRALAFLNKHDVELLSRNKKSFNEKFYPIYETLKSLKLNAVLDGEVLVLNDKGVSNFGQLQNWRNETDGTLIYCVFDILWYKGKDLTALTLVERQAILKEILPKTNDRIRLSKVFDTSGIEFFKAAEKIGLEGIMAKRKSSVYSLNNRSKDWLKIKINKRQEVIIAGFTKNKDTSKSFSSLILAVYKKGKLSFAGKVGTGFSDQQQKQMMKMFEPYISKKSPFEVVPDVNKRSRFQRMQPDAEITWMKAELVAEVEFIEITSEGVFRHPSFKGMREDKKAREVIREKAGPTEEIIELDDNKKLVNKEVSKMDSSELLNAKGDRQEIKIKGKTLEFNHLSKVYWPGEGITKRDLLNYYADVAEYMLPYLKDRPQSLNRFPGGIKGKPFYQKDVKDKAPDWAKTFPYSTGDGEKKEYLLGNDLATLLWMVSLGCIEINPWFSRAKKPDYPDYCVIDLDPDQQDFDQVIVAALQVKEVLDAIDVPSFPKTSGSTGIHIYIPMGAKYTYEQTQLFARIVVEAVHAALPEFTTLERSIAARKGKMYLDFLQNRPGATIAGPYSVRPKPGATVSTPLAWDEVKPGLKMKDFSIFNTMARLKEKGDLFKGVLGKGIDLKKAIQKAKQQFQ >NZ_CP049868.1|WP_166211375.1|5261164_5263606_-|DUF4982-domain-containing-protein MKKYAYPGFYYSAVTVLLMLIALKSSAQQAFNGNKELFDYGWKFNLADKSDNFSTPEFDDRNWRARDLPHDWSIEGRIDAKNPMGNDGGYFPAGIGWYRKAFSIPANWKNKKVSIYFEGVYMNAEVFINGKSLGVYPYGYSSFTYDLSPYLKYGTKNTIAVRVDNAQQKNSRWYSGSGIYRHVWLMSKDPVHFDQWGIFVTTPTVSASKAIVRVEAKLNNDTDQPKNVAVSISVFDKSHRKAATKTIQVKLQPRSSNSITENLALNNPLLWDIKAPNLYYAIVEIKDNKKLLDKEIQNFGIRSIKFSPTKGFELNGKTIKLNGGCVHHDNGSLGAAAFDRAEERKAELLKAAGFNAVRTSHNPPSPAFLDACDKLGLLVIDEAFDGWRTGKNKYDYALYFNDWSERDIAAMVKRDRNHPAIIMWSIGNEIIERKEAKAVETAKLLSSYIKKHDQTRPVTSAMTTWDKDWEMFDPLMAAHDVAGYNYQLHHAAADHTRIPSRIIVQTESYSRDAFTNWELVQQNNYIIGDFVWTAMDYLGESGIGRYYYPGELEGQHWERDLFPWHGAYCGDIDLTGWRKPISHYRSMLYNDNEKIYMAVKEPNPANGVIKETMWSVWPSWESWTWPGCEGKEIQVEVYSKYPAVRLYLNNKLIGEKTTTVKQQFKATFPLAYQQGQLKAVGILNGQEKEAVILSTSGQAAQIRLKADRKRLYANGQDLSFVTVEIVDKQGNIRPDANHSLTFKLSGAATIAATDNADLKDITPYTSNTRKPWNGRAMVIVKSSDKAGNIKLQVSSPGLPDAWLELTSINKGRK >NZ_CP049868.1|WP_166211372.1|5260662_5261031_-|response-regulator-transcription-factor MKKIFLHEPDLASFEIISLILADEGCQVKTLPYWDGDLATAVVSYGPDLIIMDCFQDLLRPARLCRVIRTLCPQTALIASSCNTDIDLTYRKMGFDTYLRKPFDIARLITIVNRYTPVAANC >NZ_CP049868.1|WP_166211369.1|5260251_5260593_-|hypothetical-protein MIVSGLLNLPPERTNLLLAGIPIITHYKMEENDFVAIWLEETGNPAIERLSQLNLAVAAKTAAAIANNELSEQDLAIALDVNPDEIKRWLTGRHTFSMTIITEIAAKLEAHTG >NZ_CP049868.1|WP_124560413.1|5259824_5260178_+|hypothetical-protein MIADNNALEEAIAQLKAKGYTLTFSPDDAHTAAWGVAGPWPTDIEYHIDEEISCRVYNDGDETHIRVLAVTTKPFGLKGIQLVNAEQQRYWTVDEILVGFSKMLKATKTFLFRSKSS >NZ_CP049868.1|WP_124560414.1|5259525_5259759_+|hypothetical-protein MKKTSYYLMIGGSVLLVVTLLTGGQLNAINPVDSHPWTININGIRSFPWPEFTGGLLIALGLIFNIATWHQKKSRIA >NZ_CP049868.1|WP_166211366.1|5257626_5259498_+|chloride-channel-protein MNKIKNIIPISPALGIFGKFKMGKHKEKSSKKRLLFISMLSVGVAIGISFIAKVLVSLINLVTNISFYQQFDFSFHSPADNHLGLLVIIVPVIGGVIVGFMAFYGSKAIRGHGIPEAMEQVLTNQSKIKPSIAILKPVSSAIAIGTGGPFGAEGPIIATGGALGSTLGQLFTVSPVERKIILAAGATAGMSAIFGTPLAAVFLAIELLLFEFSPRAIIPVALACITGAAGHHLLFEAGPVFPMPVLSAPSNAALGIYSLIGILVGLASLGLTKVVYFVEDAFEHLPLHWTWWPAIGGLAVGVVGYFAPRTLGVGYDNIISLLSGQLSISVILSLCLFKFISWAIALGSGTSGGTLAPLMTIGGATGAALGYLLHAAFPALAISIPMSALVGMSAMFAGASRAYLTSILFALESTQQIQGLLPLLGACSGAYLVSVFLMKNTIMTEKIARRGIHTPDSYEPDLLLKLRVTEVMDRSPVFISSYNTIAEVRKYFVANPPKENQYAVRDTAGAYMGTISVLDIFQWVKEDMASITAIIKSEDEQIKGNEPVRKALELMHSTGNDFVAVVSGRDGTSFEGLLSYKDIVRAYSTNQEKESRIGRNLSMDRQAKKMIVKGKKMMADRRV >NZ_CP049868.1|WP_124560415.1|5256734_5257436_-|Crp/Fnr-family-transcriptional-regulator MKECNNACDLKRCYLCSRVIADWLPAVSQQKKNFQIKKGEQLFSEGDAVNGIFFVYSGTIKVHKKWDNEKELIIRFARSGDVIGHLGLGKNPVYPVSATALEEAMVCFIDLQFFRSSLRVNPDFTYELMHFFAAELQESHERMRNLAHMSVKGRIANAILSLQSQFGTDTSGAIDIDISRQDVASYSGTTYETLFKIFTEFSKGGKISAQGKRISILDTPFLQQTVAADNQKN >NZ_CP049868.1|WP_166211363.1|5255002_5256529_-|PAS-domain-S-box-protein MIESNDIAAVINELEKLALDLNLDNEKLLRLNAVLKTAEEKNAILQSINESSDDAIISKNLEGIITSWNSSASRIFGYTAEEMIGVSILRLIPAHLQYEETEIISKLHRGIKINHFETRRMRKDGSLVAVSLTISPILNYKGVIIGVSKIARDITDRLSAEVNSKRLSAIIESSDDAIISKDLNSIVTSWNESAVRIFGYNAEEMIGQSILKIIPQDRLDEEPKILSQLSQGIRVDHFETIRRRKDGRLIDVSLTISPIKDSTGRVIGLSKIARDITEKKQADKKKEEFIGLVSHELKTPLTSLRSYVQVALFKARNEKNEFIDKALSKAEIQTKKMEAMIRDFLNISKMEDGQLRLNLNPFDLPALINNCLSDVTITTSKHHFNYIGEAHAMAIGDAEKISLVLINLISNAVKYSPEGGEISITCQKQDKAFTVSVKDNGIGISKEEQKFLFRKFYRIQSEQTRTISGFGIGLYLVYAILELHGTCIRVESEIGKGSTFVFQIKTAD >NZ_CP049868.1|WP_158674053.1|5253341_5254415_-|hypothetical-protein MKTKPSILRLLSVFMLGIVLFSGSCRKDNLPDATTSSLSLKGKLAAIPPNEPQLTVANGTFYIVNRKSGKVLDVGAFQTADGSNVSQYAGTGGTNQKWTLTSLSGGYYSIIGVHSTKALQVDLAGTADGDNVNISTNTGANNQQWQFTSIGNGYYRIINRNSGKDLDVAGQSIDNGANVDQWTYWGGENQQWSLLTVNAGGQLNWTLNSTGVPADVVTRITNAMNDACARYNAGGNWPSRTLTVQYNTGVATADGSTNGNIRFGANTSYQNVRTAMHEIAHTYGVGLSGGWTTNTSTGDFLGTNTVALVKIFDGTSGAIHTGGGHFWPYGLNYDNEWSETNAFRHVKLVYAMRSDGM >NZ_CP049868.1|WP_166211380.1|5268174_5270811_-|TonB-dependent-receptor MKFFIKSAWLLLLLAGFCLNSFAQNYSVKGIVLDTAGQPLPGAVVRIKSKTDSVGISANPDGTFIIAKIKSKQFTLSAAFIGYDTFTKQYLIEKGNSLTIENIKLKPSSNTLDAVVISGVPPVKVTEDTVSFNAKAFPVREGDAVDEVLKKLPGVKVDKDGNVTSQGAPITKIRVNGKDFFGTDVATAIKNLPADIIKNLQFIDDYGDQAKLTGIKTGEPEKILNLTIQEDKKKGYFARASAGVGNADRYNTSIRGNSMKGERQLSFDATSANANMRGGGGDGVTTRNAVGLNFKNEFSPKLSLDAGYNFNNDRNNTISTTYTQNILQDAGQNINRLEDAQNNNKSDNYSHWMGGNLEYKIDTMNYLKISPNFNYNTGIGNSTGGSLVTQDTLFTRRESTNANSSNSFSAKANIFYNHKFAKKGRNLSSWSNINYSNGGNNRNGYNQYINMHGSKTDSLIQNQLNNQDNNNFGLNVGASYMEPLWHKTFIELNYSWNRTSTNNAKETYDVMAGSQVFNPQLSNIYDYQFVTNKVGMNYRYIGEKLNYTVGINAQPAVLTGQNLSHNVKTENRTFNLIPSGRFSYKFSNQQSLDVNYWGRNNQPGFLQLQPITDNSNLQNEITGNPDLKPEFVHSVNAHYKLADWSAGKVILANFRYERTDDKIVTTKARVPGTVNQLTSYTNTDGYYTIQGDYNISKPLSAERKFTIGYSGSGQLNNNISFTDNSRIEAKNISWRQELEFRVDLKDITNFEIETSYSQNLTSYTNTTLSNRQSNRFEYGIEGRNYFFKDLTLGYDFSKQINNGFDNGAVRNPTLLRLSMEYKFMKNDMAAIRVEGFDLFDQNSGISRDVFDNVIVDRQVNRLGRYFMLSLIYRVRKFG >NZ_CP049868.1|WP_166211383.1|5271024_5271714_-|DUF4397-domain-containing-protein MKKTVNYLKYVMAISLLALSLVACKKDSKTDQPVATTATLSFNNGLDLTGKFDFYVNGIKKASLDALLHSDYSEVPEGKLTVKVSNTVSSATLASADFTLTAGRNYSVFICGTASAPTLVLTEDNLNVPIKDSGKIRFVNLSQGAKGLDLNVRGKQPVFSNLAYKSATNFENMAVAAEVDFDLRETGNNQVINSLEKVKIENGKIYTIIATGDRSENSANVKMTVITNK >NZ_CP049868.1|WP_166211386.1|5272063_5274328_+|catalase/peroxidase-HPI MEKDPNDISKCPFHNGSMKNNVGGGGTRNNDWWPKQLKLNILRQNSALSNPSDPDFNYAEAFKSLDLEAVKSDLHTLMTDSQDWWPADFGHYGGLFIRMAWHSAGTYRVGDGRGGAGAGLQRFAPLNSWPDNVSLDKARRLLWPIKQKYGNKISWADLMILAGNIALESMGFKTFGFAGGREDAWEADESVYWGAETTWLGGDLRYAHGSDGADKAHGVVVTDDDADGDIHSRNLEKPLAAVQMGLIYVNPEGPDGNPDPIAAAKDIRDTFGRMAMNDEETVALIAGGHTFGKTHGAASADHVGKEPEAADIASQGFGWSSSFGSGKGADAITSGLEVTWTTTPTKWSNNFFENLFRYEWELTKSPAGAHQWVAKNAEAIIPDAYDSAKKHLPTMLTTDLSLRFDPAYEKISRGFLENPDAFADAFARAWYKLTHRDMGPRERYLGADVPQEELLWQDPIPAVNHTLVNESDVTALKSKILASGLTTSELVGTAWASAATFRGSDKRGGANGARIRLAPQKDWKVNNPVQLQKVLGVLENIQQDFNAGQTDNKKVSLADLIVLAGNAGVERATNGVIVPFVAGRMDASQEQTDIESFGYLEPAADGFRNYRNPRVPVATEELLIDKAHLLTLTSPELTVLVGGLRVLDINFDGSKHGVFTQNPGQLSNDFFVNLLDMNTAWKATSEDRELYIGSSRKSGQPKWTATRADLVFGSNAELRAIAEVYASTDGQQKLVKDFVAAWTKVMNLDRFDLA >NZ_CP049868.1|WP_166211389.1|5275928_5276825_-|LysR-family-transcriptional-regulator MFDFRLKVFYIVAKRLNFTRAAEELFITQPAVTKHIQEIEAFYKTRLFDRNGTKIKITQAGNILLKHAEALINIHRNIDFELSTLAKNIKGTLRMGASTTIAQYFLPKYLASFRQQFPDITVSLKSNNTEAIENLLIENKIDLGLVEGQSKRPHIKYTPFVQDEIVLCTSNTNPMVKKTTISLGDLQKLPLVLREPGSGSLEVVAAALKNVGLSLSQLNRDLELESAESIKAYLLNTNAFAFLSIHAILKELKSGELKVVDVKGLDITRVFYFITQQGDTPDLQEIFIKHLASHNLKL >NZ_CP049868.1|WP_166212615.1|5277010_5277757_+|AAA-family-ATPase MNITDLIISDKEQIQLNDLFLDEYNRTMLNQLIREHSYIEQLRQYELPVNNKVMLHGSSGCGKTTTAKAIAAALGKNLLVLNLSNVISARLGETAQHVKMVFDKAKREKAVLFLDEFDQIGKARSEGDKDVGEMHRLVNTMIQMIDYFPENALLICATNYESFIDPALLRRFQLRLSFTMPGNAVLDAYYDKLLSRFPEHIRIIERKYGISFAEAKDHAYRLVKGVLISEFELQTTLSEVEETQILAN >NZ_CP049868.1|WP_124560400.1|5279939_5280422_+|hypothetical-protein MIELDYFFTQNDEKSGHYQLIQFAQNEPWRLVQDGELLGSLEKWNGKWQQLSGNPLSDALLQGISKMIESQHYHQLPAKLLSRWGNVIAEVVTKSDHEYLIICKEAVSFRSFVTIFSKFVSTMLNDEWPVSFKLFNADFSEDFELTAHPVKASYSFGWKD >NZ_CP049868.1|WP_124560399.1|5280424_5282305_-|gamma-glutamyltransferase-family-protein MKKLVLFLLCGMVTARTIAQQTQKPMLYGSNWMAITGKPMAATAGSMIFQQGGNAVDAACAMLAATCTMWDTLSWGGETQALIYNPKTGKVIAINAMGIAPTGATVDFFKSKGYNFPPEYGPLAATTPGTPGGLIYMLSQYGTMSLGQVLAPSMQMAAGYAIEAQAVNSIERDKERIKTWPYSKKVFLTHPDEKREAPAGGEIFVQKDLLSTLTKMVEAEKEALKKGKSRKEALMAAYDRFYKGDIAREFVRGSKEQGGLITMEDLAKWKPVEEAPLTTNYKGIEVYKLQQWTQGPMLLQALNILENFNLKEMGYNSPKYIHTVYQAMNMAFADRDFYYGDPNQAPTEPMKGLLSKDYAKQRASLIQFEKNDDKIGPGDPYPFQGQKNPYLNLLKSRGFEIDTTKRNFAPKHDLGNYTPKEVYEDRLWRGTTSIEAADKEGWVVSVTPSGGWLPACIAGNTGIGMSQRMQSFVLDSTLNPFNVVAPGKRPRVTLSPSLFLKDGKPYVSAAVQGGDTQDQNLLQFFLNMAEFGMTVQKATEAANFNTNQLWLSLGGSKTADRAPKAGQILLNSNTKEEVRTALKNMGYILSFGDRTSGPINAIYFDREHGSLWGGSSNHGEDYGIGW >NZ_CP049868.1|WP_124560398.1|5282540_5282918_+|hypothetical-protein MLLIILNSIFCLSFIGFAYVNLNDEDPYLWVSIYLSAAICCGLAVFGLYYPLVYLFLMAFYLVYAAILFFAKDGVRDWVMKYKRPSLVESMQATKPYIEQTREFFGLLIITGALLIDYLVATGTI >NZ_CP049868.1|WP_124560397.1|5283830_5284817_+|hydrolase-TatD MCCSNSIERDKAMMGEPEAFDISVVSGMKFFDPHVHMTSRTTDDYQAMADAGVVALIEPAFWLGQPRTGLDSFRDYYSSLIGWERFRSSQFGIKHYCTIGLNSREANNESLSEQVMEILPLFIYKEGVVGIGEIGFDDQTAAEEKYYRLQLELAKEAGLPVQIHTPHRDKKKGTQRSMDIAIEHGLDPYSIIIDHNNEETVKEVLDRGFFAAFTIYPFTKMGNERMVEIVKQYGPERIMVNSAADWGISDPLAVPKTAALMKMRGLSNEAIEMVTYRNAITAFAQSGQIDEADFNAPQSIDQSVKFEGNTILRGGQQPRTDKSSIIIS >NZ_CP049868.1|WP_124560446.1|5284851_5285706_+|UbiA-like-protein-EboC MRPANVVTSVADILAGIAISGILTAGFAVPWLSVFYLCASTACLYAGGIVFNDVFDAELDKIERPERAIPSGIISLQNATLLGSLLLLAAIGLAFLNSVDSGTLAILVAIFALLYNKFGKHHSFFGPLNMGLCRGFNLLLGLSIVPEMLYSHYYLAIIPVIYIFSITMTSRGEVHGGTAKNLYLAALLYGIVICAIAYFAFINDRLWWSLLFLLPFAFMIFKPLFKAIKQPIGKNIGAAVKAGVISLILMDAAWAVTFDALILAFVIAALLPVSMWLSKLFAVT |
You can click texts colored in the table to view more detailed information
CRISPR_ID | CRISPR_location | CRISPR_type | Repeat_type | Spacer_info | Cas_protein_info | CRISPR-Cas_info | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
NZ_CP049868_3 | 5420998-5421099 | Orphan |
NA
Consensus repeat of NZ_CP049868_3
|
1 spacers
spacers of NZ_CP049868_3
>3.1|5421024|50|NZ_CP049868|CRISPRCasFinder TCCGGCCTGCTAAAACAGTTCAACCTTAAAAAAAGCATTATTACTTACAC |
CRISPR arrays and Neighbor proteins around NZ_CP049868_3
The CRISPR arrays of NZ_CP049868_3 >merge|NZ_CP049868|3|5420998-5421099|CRISPRCasFinder CATGTAAGTGATATAGCGAAGCTGTATCCGGCCTGCTAAAACAGTTCAACCTTAAAAAAAGCATTATTACTTACACCATGTAAGTGATATAGCGAAGCTGTA >NZ_CP049868|3|3|5420998-5421099|CRISPRCasFinder CATGTAAGTGATATAGCGAAGCTGTA TCCGGCCTGCTAAAACAGTTCAACCTTAAAAAAAGCATTATTACTTACAC CATGTAAGTGATATAGCGAAGCTGTA
>NZ_CP049868.1|WP_124560290.1|5418499_5420791_+|polysaccharide-biosynthesis-tyrosine-autokinase MSKQIINGGAKDFAETMISFARNWPYFLLSIAICMGAVYGFLYITPPKYKVTSTLLISDDKNGAAMSNSTAFSDLNMFQTVKTVDNEIEILRSRDLIFKVLKKLNLETAYFKKEGFREKELYGKTSPLVVTAISLKNGAYARKINISYLDDISYIIQDSLNTNIVKYGDTLHNKNYVVKVEKGPAFQREFGKIKIQFKNLYKMTEAYSLVSLKIVPVVKDANTITISLNDVVPQRGIDILNDLIETYNINNVNNKNTIARNTIRFIDNRLKYLVSDLSGTEEDVENYKQQNRVTDINMDAQMNAARTGEYNQLLENSSVQLRILSSIESYFRGKQSQYDLAPSAMGLKDPILNSLISKFNDLQLERNRMLRTANAENPLVLNLNEQLATLKTNILENLSSIKQGFVIERNNLRANYSQYDSKIKSVPTIERGLLERSREQSVKSGLYKYLLQKREETALSLSATVPTSQVVDKPAYNTTPESPKQPLLYLCSFILGFLVPAGAIYIKGFFNNKVQDASTIELTGARMLGELSHNLDKSTIVFQKDNRSTISELFRYIRMNLGLMAGNGDNKVMLVTSSMKGEGKTFFSVNLATTLGMLDKKVVVLEFDLRKPDLLNKVGLKQTVGLTDYLIDDAVFLEDIIKPTKISEHISVIGCGKSPENPAEVMMSPKMDALFDELKDRFDYIIIDTSPVGQVADAFSLAEYADVSIYLVRYNYTNKYQLAILKDICENNKLKNPMVVFNDAKREKNQKYSYGGYGYAMAN >NZ_CP049868.1|WP_166211477.1|5417718_5418477_+|sugar-transporter MKKVILFIAIYTCLATGCAPRRDLVYFSNLAKQTSEEKLPAQEVKIQQNDLLSVSINSLNQESNVLFAVNTKVPSAENNYKVEGYRVSKDGMINLPVVGNVRLEGLTIEQAQTTISRELDKYVKKPVVDIQLVNFKVTVIGEVNRPSNFTVQGDNINLLQALGLAGDMTVYGKRDNVLVIREQNGQRVMKRLNLNNQDVMNSPFFFLKQNDIVYVEPDKSKASEYSTNTRVMPLVIASISAVAVLITAVLKQ >NZ_CP049868.1|WP_124560292.1|5416318_5416996_-|acetyltransferase MKVIIYGTGKMAEFIGYSFMNDSPYNVVAFCVDDAYVPPAGSTLLGLPILSFAQVTKDFPPDANKMHIAIGRNSARESIYNKVNEAGYHFANYISSKANIWPDLVMGHNIFIDQCCDIQPFVAIGNNCMLIGSRIGHHCTLENNVLLSGNILAGNVTVGHNSFLGINSAVKEDVIIGTHNIIGAGVFINKNTEDYAIITNASATQRIGDSKRFVMFTKTPDAKPA >NZ_CP049868.1|WP_124560293.1|5415851_5416241_+|response-regulator-transcription-factor MGKKRIHILEDDQEIRNVIEILLSDEGFELQLSSSFAELKKNIQDAMPDLFLLDVMLPDGNGAEICEDLKTDIFTKHIPIIVMSAQNNSEQKAIDAFADDYISKPFDIDDVLKRINAQLQKSADNSVKI >NZ_CP049868.1|WP_124560294.1|5415042_5415807_+|DeoR/GlpR-transcriptional-regulator MMNLAERHQFILSRLQRDQYINVVDLCKELKVSSVTIRKDLKLLEDKSLLFRTHGGATVNNPYTVDRPVNEKEKLQSTEKNKIGIAAAGMLNDNDSIVIASGTTVLYFAKNIAPATNLTVVTSALNVALELMREPSIEVIQLGGLLRKSSSSVMGAYAEQVLQDFYFNKLFLGVDGIDLDFGLTTTNAMEAHLNRKMIGASQRTIVLADSTKFGKRGFGKICGLEEIDHIITDKGISDQIVKHLESLGVTVTIV >NZ_CP049868.1|WP_166211474.1|5413243_5414839_-|glycerol-3-phosphate-dehydrogenase/oxidase MKRLHQHILAENINWDLIIIGGGATGLGTALDAASRGLKTLLVEQSDFAKGTSSRSTKLVHGGVRYLAQGDIALVRHALKERGLLQQNAKHLVDKEAFLIPCYNWFSVIKYLAGLTLYDWLSGKYSFGKSKYFSRKETLSIMPGIKEKSLKGSIRYYDGKFDDARLAINIAQTAIENGAVLLNYTKVTALIKSDGNVVTGIETEDVLTGEKAKHHGKVVINATGVFVDDILQMNNPNAKKLVRPSQGVHIVLDKSFLNSESALMIPKTSDGRVLFAVPWHEHLLVGTTDTPLDEHSLEPRALKEEVDFIMATATSYFKRKPLETDILSVFSGLRPLAAPTNNSGNNTKEISRDHKLMVSAKGLITITGGKWTTYRRMAEETVDLAISHAGLEAKACITENLKIHGTTNIKGDHHLDIFGSDRDRIEALIQENPNLAEKLHKDFPYTCAEVVWSARNEMAETVEDILSRRLRILFIDAQAAKDMAPKVASLLAQELSADQDWGTNQIETFNTLANGYIYHPIQINTGTALAH >NZ_CP049868.1|WP_124560296.1|5411738_5413229_-|glycerol-kinase-GlpK MSKYILSLDQGTTSSRAIIFDHNGDIIAIAQREFTQIYPKAGWVEHDPMEIWSTQLAVVTEVIVKAGLTVSDIDSIGITNQRETTVVWDKETGMPVHNAIVWQDRRTSAYCDEIKAQGLSGRIQGKTGLIIDAYFSATKVRWILENVAGAREKAEAGKLAFGTIDSWLIWKLTAGEKHVTDVTNASRTMIYNIHTLSWDDELLELFGIPKQMLPTVKSSSEVYGETAGKILAAKIPIAGIAGDQQSALFGQMCTEVGMVKNTYGTGCFMLMNIGTTPKISENNLLTTIAWQINGEVQYALEGSIFIGGAVVQWLRDEMGLISKSADVETLAKKVKDTDGVYVVPAFAGLGAPHWDQHARGTITGLTRGTNKSHIARAALESIAYQTMDVLKAMEADAGVNIAELRVDGGATANNLLMQFQADLLNCKVIRPKVTEVTAIGAAYLAGLATGFWENIDQIRSQWKIDTTFVAEEGVDNTARIKGWNRAVKAARVNAED >NZ_CP049868.1|WP_124560297.1|5410970_5411708_-|aquaporin-family-protein MNIYLAEFIGTALMILLGNGVVANVVLKGTKGNNGGWISITTAWALAVFVGVVVAGPYSGAHLNPIVTLGLAIGKGFSWSLVPFYILSQLAGAMTGSFLVWVMYKDHFDATEDQGLKAAPFATAPAIRNNASNLVSEIIGTFVLIFVIFYFTDASMGTKENTTPIGLGSLGAIPVAFLVWVIGLALGGTTGYAINPARDLGPRIIHALIPMKGKGSSGWDYAWVPIVGPIVGSTLAAVVYLLMHK >NZ_CP049868.1|WP_124560298.1|5409587_5410871_+|insulinase-family-protein MKRIIFFIAFVALFQYSHAQTKAISFDVNGLKVILKPTEKETVSISMFFKGGVMNYTAEQAGIENLALASAATCGTKNYSVVDYQELADEYGIAISGSSTTDYGTISMNCISKYLDQGWKLFSDAVVNPAFDKTEFQTTKERMISAIYHSQSDPETRVEQMSMESMFKDSPYSINPLGSSKTVGGFTAEMVSNYYHNELLNKNKMFLVVAGKITKEALEQKIQASFKELKGKPYTPPVYDRKMLTGERLVVEQRDIATNYMSCIMNAPTMNSPDYHAFVLIINALSGSMNYELRTRLGLSYAPGATIKTQQIPYSSMFVSTTQPKKAFQAMVTVYNNIKEGKYSQRYLDALKKDHRDGYYRHQESASSIVEDLGEAEVLGSYTLVEDMVPNFNKVTLADMKDSFTKYLKGAIWVYLGDEQVGKAAFQ >NZ_CP049868.1|WP_166212629.1|5408204_5409578_+|insulinase-family-protein MMLSRLFCVIACIMCLGSAFAQKKLAENMHFKKLPNGLEVLVVVDRTVPLVTIEMACRNGSFTETDEFNGLSHLYEHLFFKANKDYPDFESLNGRMNDLDINSNATTREEVVNYFFTLPAANLKAGLSLMNSSIRYPKFIKEDMALENEVVNAEFTRHESSPIFALMEANSRHMWGTNYSRKNVIGSHEVILSATPSKMDSIKNKYYWPNNSVLVIAGDVKVDDAFSYVDYIFSGWKPSKVDPFVKWPIPEFQPLTKNDYYLVESNKSPVPYMLFSWHGPDTRNDIPATYAADVFSFIVNQNGSKMKQALINSGLAQEADVNYYTQKYTGPISLMVSPNPAKVKECYDEVLKQISLWANEDYLSDLQIERAKRLLSIEQVERREVTSDYAHLLSFWWASASIDYYTHYEEEVNKVTRKDLLDYVHKYIKDKPYCAGLMMDNASVKTVKPETFFKSTN >NZ_CP049868.1|WP_124560289.1|5421141_5421690_+|UpxY-family-transcription-antiterminator MESKINYRASFAKKWFVIYTRPRWEKKVDKLLQEQGFESFCPVRNVENQWADRKKIVSLPLFTGYVFVKIDERDGFKVRYIQGVLNFINYMGKPAIVRDSEIERLKHIMDAYNDVDVVSLSGVSKGDRVRISNGLFHNQEGEVIQIQGKHVLMSFDHLDCAVVTRVPISNLTLTVNPQQHYV >NZ_CP049868.1|WP_166211480.1|5421682_5422981_+|nucleotide-sugar-dehydrogenase MYNSEDQLKMSVIGLGYVGLPLAVEFAKKYKVFGFDINQSRIAELKAGYDNTLEVSEEALNEVLTFECTTLQGLYCTNELEKLRSSSVYIVTVPTPVDKNNRPDLSPLLKASAVVAKVLKKGDIVVYESTVYPGVTEDECVPILEKGSGLVFNKDFFAGYSPERINPGDKQHTVANILKITSGSTPEAAEKIDALYRSVINAGTYKASSIKVAEAAKVIENAQRDINIAFVNELAMIFNQIGIDTSEVLAAAGTKWNFLNFKPGLVGGHCIGVDPYYLAQKAQEAGYHPEIILAGRRVNDGMGKYVADQIIKKMIAKNIHIVGAEVLVLGFTFKENCPDVRNTKVIDIVRRLEEYKVNVTIHDPWANADQANHNYGVICENGSSKIRRYDGIVLAVAHQEFDKLNIAELRKPTCVVYDIKSVLPQSMETVRL >NZ_CP049868.1|WP_124560287.1|5422986_5424429_+|lipopolysaccharide-biosynthesis-protein MSLTYKARSGIIWSIGQQFSVKFINLFITIILARLLSPAEFGLIAMLSIFIAVGNSLMDSGLTSSLIRTRTAGQKDYSTIFFFNLLGSLVVYGVFFIAAPFISDFYRQPQLTNIVRIYGLTFLINAFFSIQSTLLTKEMKFKLQTIIQIPSVILGGCLGIFLAKNGYGTWSLVWMSLLSATVSTILHWFYSDWRPRLLFSKKSFRKHFHFGYKMTLSGLLDTIYQNLYTVIIGRFYAATQLGFYARADSLSQLPIGIISTAINKVTYPMFSNISNDDVKLKMVYKRLMQQVLFWNAPILIFLALIAQPLISLLLTDKWLPSVPYFQILCIAGVLYPLHAYNLNILKVKGQSGQFLKLEVAKKTLSVIGIICVIPFGIMGLLYFQLFFTVFAYYINSIYSGRLINYPLKEQLHDIAPILMLSSLLGLACYGLDNWCMSHYHINNFLRILGLSIIYAGFYLGISNTIRLAALTDFKQLILKQ >NZ_CP049868.1|WP_166211483.1|5424425_5425583_+|DegT/DnrJ/EryC1/StrS-family-aminotransferase MIPVTKPFLPKQADFKSYVSSIWARQWLTNNGPLVNELEIKLQQYLALPHLLYVTNGTIALQLAIQALEIKGEVITTPFSFVATTSSIVWQGCTPVFVDIDEETLNIDPNKIEAAITPNTTAILATHVFGNPCDIDAIDRIAKKHNLKVVYDAAHCFGTKYKGKSIFAYGDVSTTSFHATKLFHTIEGGAVFTQNPDILKRMALMRNFGYSGVDTFSELGTNAKNSEFHAAMGLCNLNYIDQILSKRKELSEHYTMRLNKIDAQFQVVQPDTDFNYAYFPVIFRSEEIMLDCMKQLELVQVYCRRYFYPSLSALPYIDKVNMPICDSIARRIMCLPLYHTLTSADQDLVVRIILRTQNYRKKQVVKLADYGHLVNGSQAIAVNGR >NZ_CP049868.1|WP_124560285.1|5425582_5426467_+|glycosyltransferase MSSFIMEPNHNEIMVSIFCITYNHSKFIAKALDGFLMQQCNFKTEIIIGDDCSTDGTAEIIDDYVARYPGRINRLKAPKNIGATQNVIRVALETKGKYVATCDGDDYWTDPYKLQKQVDFLENNPEYVMCCHYTREINFDDTEVFYMNFNPVPLKYSFSDLIINKQVETCTATIVYRNIEPIKDLYRNEWFLKCHACDKFLKLYCTWVTGKKLYVLPEVMSCYRRHPGGIWSPVSYVPLKKMQLSDFNILIKIFTYTGLQKIKLLHFYLKKYFLFEVKHKTFGNAFQTIKTIVN >NZ_CP049868.1|WP_166211485.1|5426487_5427567_+|glycosyltransferase-family-4-protein MLRNKQLRRGGAERVISNLANHFSSKDCSVTIICLNKAQVKYHINEQVKIVSLLEREDSHNSLNRIRYGFLTFYRLLVLLKKEKPNCTICFMTSANIWAGLCCMILGLPYLVSERTTPDATLNQYNKLLQWFIFHIYRKSKAIVLPAFGMFNGFKRIKQFEKLHNFKTIYNPIHQFVKPNPGSVNNKPFILSVGRLSHEKGFDLLIDAYSRLQSLDVDLLISGEGPERSALEVQIANLNLTGKVKLIGFKSNPQDYYAQASVFVLSSRNEGYPNALVEAMGMGCACVAVNCEFGPSEIINDGVNGFLVEQLDVSALSMAIDKLLNNRDLKKQFSDKARLINETNSIERISANWEELILS >NZ_CP049868.1|WP_166211488.1|5427563_5428361_+|hypothetical-protein MTKKIMFLFLLFGYVYATTFNIFMTGIFRIPAPVVFLAPLIYFYRTEITRFSYGKELLVFFIAAMFFYLIGQADITSFFALLIVAGCFALLFNYVIGTNIQRMNIAVGFFFGVLLLSGLIMFIDHEYNMAPIRSLLVQEDVLQAPAGISTTIFTFGYQMAALTPFMVVNAVLFKRSWLLNLLLFGLSMCLIFFGMQRSVMVAFAVVVGLFFLSYYKFKSVLLFGLLAGMFFIAQSSLEQFSGDKKQQNILNKSAENARGKKNGAI >NZ_CP049868.1|WP_166211490.1|5428360_5428780_+|hypothetical-protein MGENIQIIADYPFGLLFYGKTWNDVVQHNFVYKKGPVVITSHNAYLMFITYLGPLLGFILLILLYHKVGKVIFYAFLHVKDKKNALLVCLCCSFVAISINSFFHNEWLLATSGPTLFLYFAILQLSKIKMEDPILVQYN >NZ_CP049868.1|WP_124560282.1|5428838_5430113_+|DegT/DnrJ/EryC1/StrS-family-aminotransferase MNIPFSPPFIDQSVVDQVLDTLNNKWITTGPKVKALEQEVKVITGTDEVICVNSWTSGAILMLKWFGVKAGDEVIVPAYTYSATALAVLHCGATPVMVDVLEDFNIDPEKVRAAITSRTKAIIAVDIAGWPCDYAALKAVISDPRIQKKFRCASDKQSLLNRILLISDAAHSIGSTYLNKPAAQNCDVTIFSFHAVKNITTAEGGAICLNLPTQFDHEAEYAYLKMYTLNGQNKDALSKSRGAGWRYDILFQGLKINMPDICAAIGLAQLRKYDNDLLPQRKAIAKKYFEGFQDQDWFISPPLVSTQRESCYHLFPLRVKGLSEEQRDQIIDDLAALGIATNVHFIPMPMLTLFKNMGYKIEDYPMAYQNYACEISLPIYPQLTQSEIDFIIPSVISCVQIQLNRNIKVIETNVVELKQMAVAS >NZ_CP049868.1|WP_124560281.1|5430109_5430712_+|sugar-transferase MKTDKKRVFDVVFATLCLILFSPLLILIAIVIKLDSKGPVIFKQIRVGRNMKDFHLIKFRTMKVVQSNNSLLTIGNHDNRITKIGYWLRKYKLDELPQLLNVLKGQMSFVGPRPEVRKYVNMYSEEQRYVLSIKPGITDWASVEFCNENELLQHAEDPENYYIERIIPAKIKQNMRYIRQHDIFTDFKIIWLTLNRIVIN |
You can click texts colored in the table to view more detailed information
CRISPR_ID | Spacer_Info | Spacer_region | Spacer_length | Hit_ID | Protospacer_location | Mismatch | Identity |
---|
CRISPR_ID | Spacer_Info | Spacer_region | Spacer_length | Hit_phage_ID | Hit_phage_def | Protospacer_location | Mismatch | Identity |
---|
Region | Region Position | Protein_number | Hit_taxonomy | Key_proteins | Att_site | Prophage annotation | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
DBSCAN-SWA_1 |
4252513 : 4278017
Sequences of DBSCAN-SWA_1
Nucleotide sequences of DBSCAN-SWA_1 >NZ_CP049868|4252513:4278017|DBSCAN-SWA GCTATTTAAGCCCCATCTCTTTCTTAATCTTTGTTTCTAGTCCCTTACCAACTTCTTTTGCTCCGTGGTATGGTACTGGGTATTTCCTGCCATCTTTCTCATAGATGTAGTGACTACCCTCAGCCTTTAAATACTTCCAACCGTTTCGGCCTATTAAACGGTGTAACTCTGAACTCTTCATAGAACTAATTTTTGTTTGACGATATAAAGGTAGTAATATTACTACTCTTTTCCAAATGTTTTTGAATTTATTTATTAATTAAATTATACGTAATAGCGGTTGATAGTTTCACTTAACTGTATGAAAATCTTAAAACAGCAATATCAGTCAGATAAATATTATCCCTATATGGATAATTTACATAATTTGTTTATCTTCGTTCCATGAATGCTAAAGAGACCCAGAAGTATCAGAAAAAGCCTGTACCAGCGCTGATTAAGTTAGCCACAGAGTATTTTAATCGTTATGTGAGAAATAGGGATGCCGTTAATGGCCGCGTCAAATGTATTTCGTGTTCAACGCTTGTTCCTTTGTTAGGAGTTCATGCTGGGCACTACAGAGCGTCTACATTTGCTGCAACTAGATTTGATGAAAGAAATGTTAATGGACAATGTGCGCGTTGTAACACACATTTGCACGGCAATCTTATTGATTATAGGATTAACCTTATTGATAAAATTGGGCTGGAAGAGGTTGAGGATATTGAAATGATCTCTCGAATGCCTAGTAAATGGGATCGCTTTGATCTGATCGATATTATTATCAAGTATAAGGCAAAGTGTAAGGAGTTCGAATAGTGGAAAGCAGAAGAAAGTTTATCGTCATTGGGTGTGGCTCTGGTGGCTTTTCAGCTCATGTACAGCGTATGGGTGGGATAAGTTTCGGTAAATCTTTAGCTACCCAGATATGGCTAAATGAGGCTCGCAGTATCGAAAAAGAGATAGAAAAGGGGTTGTCTAGTTTAAACAAGTCTTATAACTGCGATTTTACACGAGATGTTATAGCTAAGTACGCTGTAGCTTTTCACAGATCAGAGTTAGCTATGATAGAGCTTATTCGTTCAATTGTTTCTATATCTCAATCATTAGGAGCGGATAGCTTAATGCAGTCTGCTGCCGAACAATTAAAACATCTGGGTAATAGAGGTAATTATGCCAGTGATGAATTAAAAAAGATGGTGGCATCAATTCAATTTGATAAAGCCAAACAGCCTAATAAGGGTATGTCAAAAAAAGGAGGACGAAAACAAAAAAATCGTTATCCATCACATTACAGATAATCATGAAAATATTTCTTTACGTTATTGTTTTAGTTATTGTCTCAGGCCTATTATTCTCTTGGTTTGAGATTTATGTTCTAGGAGCTTATTATAAGAATGCAGGTTTAGTTTTTGCATTGTTATTCGGCTTATCTCCGGCCATTATATTCTATTGTGCTTTTAAATTAATCACACAAATAAAAAACAGTTAAAATGAGAAAACTATTATTAGTTGCCCTTTTAGGGTTATTCCTTGCCTCTTGTGATAGAGCGCAATCAAATGTTCAAACTCTTTATACGAGTAATTGCGGTGTGTCTTGGACACTGATCAAGGCTGGCGAGACATTGCCTAAGGGTATCGGAATGTGCTCCTATAAGATCACCGTGCCAGATTACCCAATGCAGGGGGAGAGTGTTTTTAAGTCTGCTTTTGCTAATCGTGTTATGGCTAAGATAGAGGTTACTTATGATTATTCCATTACCGATGCTATTTTGTATGTCGGTGAGGCTAAATACTTAGGTAAAATAAACTCTGATAGTGATAGCGAGACAAATAGCGCAAAAGCTTATGAAACCGCTGAAAATTCAGTTATAGATAAGAGAATAAAAGAGGTTGCCAGGGATTTGTTAATTAATGAGGATATAGTTGATTTCTCACAGGCTGAATTTGAGACGCTACTTCTTGAGAAAGTTAACGAGTTACTGAAGTCCAAAGGGGTTAAAATTAACTTCTTGTCGTTCGTCCCTATTCCGGAGGATCAGACTCGGCAGGCTATTGACGTCGTTACAGCGATGAAAATATATGAATCAAAAAAGTTAACTGAGGTAGGTAAAAGTGTTACCTCCGCGAGGGCTGGAGCAACTAAAATTGATGTAACGGTTCAGAAAGAAAAACCTACAGAGGATTAAAAATATTGACAGCTCGGAAAGACGAGCAAATACACTCTTAGCTCAATGGAGAGAGCGGCCGCTGTCCGGTGGTAGGTTGTAGGTTCGAATCCTTCAGGGTGTACGAAAGTCGGTTTTTATACGATTAGTGAGGGGGATAAAGTGAGAGAGTTAACAGAAAAACAAAAACGGTTTTGTGAGGAGTATTTGATTGATTTAAATGCCACTCAGGCTGCAATAAGGGCTGGATATTCTATTAAGACTGCCAATGAGCAGGGGGCGCGCTTGTTAGCAAATGTTAGCATTCAATCCTATATGTCTGGGAGACAAAAGGAGTTGCAAGCCTCCACCAATATAACTCAGCAACGGGTTTTGGAAGAGTACGCAAAGATCGCATTTGTTGACATTAGAGAAGTCTTTGAGACTGATGGTGGCATTCATAACGTTAAGCAGCTAGATGACTTCACTGCTGGCGCTATTTCAAGTATAGAGAGTATTGAGGAGAAGTTTCAAGGTGTAACTATTGGGACAGTCAGAAAGGTCAAGTTTCACGATAAAATTAGAGCCTTAGATGCGTTGGGTAAGCATCTCGGATTATTCTTAGCTGATAATAAGCAGAAAGAGGCAGTTAATCATGTGACGGTGAATTTGGGAGGAGGAGTTAATCCGGATGAGGCTACTACCTAAGCAGGAAAATGCAGTTTACTTTCTCAAGGATAACGTAACCGAAGAGATCTTGTATGGCGGTGCTGCTGGAGGCGGTAAATCTGCCTTTGGCTGTATGTGGCTAATTGAGATGTGCCAGAAATACCCTGGCTCACGCTGGCTGATGGGCAGGTCTAAGCTTAAAACATTAAAGGAAACTACCCTTAACTCTTTCTTTGATATAGCTTCTAAGCTTGGTGTAACAAACCAATACACCTACAACGATAATAAGTCTACGATATACTTTCATAATGGCTCGCAGATCATCTTAAAGGATTTGTTTTTATATCCGAGTGATCCAAATTTTGACAGTTTAGGATCTCTTGAGATAACCGGAGCGTTTATTGATGAGTGTAACCAGCTTGTTTTAAAGGCTTGGATGGTTGTTAAATCCCGTATTAGATACAAGCTATCTGAGTTCTGTTTAATGCCTAAGATGCTGGGGAGCTGTAATCCAGCAAAGAACTACGTTTATTCAGAGTTCTATAAGCCATTCAAAGACGGCTCTCTACCAAAGCATAGGAGATTTATACAGGCGCTACCAACGGATAATCCCTTTTTACATCCTAGCTATTTGCAGTCACTGTTAAGGCTGGATGCTAATAGCGTTCAAAGGCTTTATTATGGTAATTGGGAGTATGATAATGATCCGTCAGCATTGATCTTATTTAATAAGATTATAGACTTATTCACTAATACGTTTGTAAAGCTCGGTCAAAAGTTTATCAGTGCTGATATAGCACGTATGGGGGCTGATAAGGGTATTGTGTTAGTATGGGAGGGATTAAAGGTGATTGATTATCTGATAATCCCAAAGTCAAAGATAACCGAGGCCGCAAGTGAAATCGAAAGGTTAAGAAAACTGCATTCAGTGCCGTTAAGTAATGTTATTGCTGATGAGGATGGAGTTGGTGGTGGAGCTGTTGATATACTTGGCTGTAAGGGATTTGTGAACAATTCAAAGGCTTTATTTGGTGAGAATTACTTTAACCTTAAAGCTCAGTGCTACTATAAGCTGGCTGAGATGATTAATGAAAATCTATTAGATCTATCAATCTTTGCGGCTATTGCTGAAGTAAAAGACGCGATTATTCAAGAGCTGGAGCAGGTTAAGCGTAAGGATATGGATAAGGATGGAAAAATGCAGATTGTTCCAAAGGACGAGATAAAGGATTTAATTGGCCGGAGTCCGGATTGGTCTGATGCTATTATGATGAGGATCTGGTTTGAAATAGATCAATTTGTTTTTTACGTGAATTAATAAAAATGAGGGTGATAAGATGGGAATGTTAAATTTATTCAAGAGTGTAAAAAAGGGCGTTATAGATCCGGCTAAGGGATCGTTTCAGCTGGTTGTTAATGGGATTGTGAGCTGGTTTGCAGATAATAAAGCAGCTTATTTAAAAAATGGTTATGGCAAAAATGTGCATGTTTATGTTGCTGTTAATGTTTATCTAAGGAAAGCAAAGGTAGCTCCGTTCATCCTAAGCAAAGTAAAGAGTAAAAAGAAGCTGGTTAAATATGATCAGTTCATGCAGTCTAAAAATCAGGAACATAGGCTTGAGGCTGCCAGACTTAAGGATGAGGCACTGGAAGAGCTTGAAAGTCATGAGATCATTGATTTATTAAATAAGCCAAATGATTATCAAACAGGAGTAGAATTTAGAGAATCTTTATTGGGTTTCTTCAAGGTTCTGGGAGAAACGTTTGTTTATGGTATCGCTCCCTCAAACGGTAGAAATGCTGGAAAGTTTAAGGAGCTGCATGTTGTGCCCCCGACTATTATTGAGCCTGTCTACTCTGGCAATATACTAGATCCAGTATCTCATTACCTGATTATGGTTGATGGTAAACAGGAGAGAATTGAAAAAGAGAACGTTTTTCATTACAAAACATGGAATCCGTTAAGTGAAACGGGCGGTTTGTCTCCGATTAAGGTGGGTAACAAGCTTTTAAAGACAAATGACGCGAACAATGCAGCTGCTGCAAAAGCTTATGAAAACGGTGGATCAGCTCACTTATTAAGCGGCAAAGGTGAAAGATCTTTAACTCCAGAGCAGATAGATCTTTTAAATGAAAGGATAGCCGCGCAATTAAAGGGAACAGATAACTATAAAAACATTGTTGCTACAAATGGAATGGTTGATGTTACTAAGATCGGTGACAGTCCAGCTGAGTTAGAGTTGATCAGTGCTGACGTTCATCAAAGAGGTATAATTGCATCTTTATTCGGTGTAGATCCTATTTTAGTAGGAGATAAGCAAGGCAGTAGTTTTGCAAATCAGGAGCAGGCTTATAAAGCTTTAGTTACTAATTCAGTAATGCCAGATCTTAACGGTATTGCTGAGGGTTTAACTGCCTGGCTATTGCCGCGCTTTGGTAATAATTTACACCTTGCGTTTGATACAACTGTATATCCGGAATTGCAACCAGATCTGGAATTGATGATGAAAGTTTATGGTAAACCGAACTTAACTCCTAATGAGGTTCGAAGTATCTTTAAATGGGATGCCTCAAAAGACCCTAATATGGATCGCCATTATATAGAGTCTAAAATGATCCCGATTGAAATGGCAGGCACTGTAAAGGCTACAGGAAAGGATGACGAAGAAAAATAAAAATATTCATATATGGATAATTTGCATAATTAAAATTTAAGTTATACTTTTACGACAGAAAGAGAAAGCTATACTAAAGTAAGCAGCTAGATAGGGATAAGTTGAGAGTGGTGTCGCGTTACAAAATAGTGTAGTTTTCTCTTTTTTTATTTAGAGGGAGATTAGTCAGATGGAGAAGTCAAAAGATATTGGTGTTACAAAAGACAAGCTAAAAGAGCTTAAATCGAAAGTAACCGATGGTAAATTAAAAAAGTCCATTGATCAAAAGCTAAACAGCATCAACAAACCAATATCAAAATAAATGAAGTTTACTTGTAAAGAATTAAGCGGTCAATCTTTTGAGACTAAGCAAGAAATGTTTGCTGCTTTAAAGGCCTCTAAGGAGGCGATTATTAAGCAAAAGACTGAAGCTGTTAAGTTCTCTGATCACATTGACTACTCACTAAAGGAGGATGGCACATTAAAGCAGGAGGATGGTTCAGCAACCCAGCTTAAGTATGGCGATTACGTTTATCCAATTATAAACAGCACTAATTACCTAGATAGTCACTCAGATCTGCATTTATACGGCATCTGGGATAAGTCCGCTGAAGAGCAAAAAGGTAGGATTTATTTCATTATCAATCACGATTTATCTGTTGGCAATGTAATCAGCTATCCTAAAGAGGTTGAGTTGATAATCAAAGAGGTAGAGTGGAGTAAGCTTGGTAAGTCATACCCTGGAAGTACTCAGGTATTGATGTTTAAAGCAATGGTAACAGAGAAGTCTAATCCAGCTGCCTTTTACATCTTAAGAGATAAAGAGGATGTTCAGTATTCTGTCAGAATGCGGTATGTAAGATTAGAGCTGGCAATTAATGATAGCTCTGAGTATTACAAGCAAGAGAAAGCGGTTTTCGATAAGTATCTGCCATTGATTGTAAATCAGGAGAAAGCTATTGAGGACGGATATTTCTGGGTTATTCATGAGGCAGAAATTTATAAAGAGGGATCTATGGTGCTGTTCGGATCAAATGATGCTACAGCAACTTTATACGATATAGAGAATAAAGATATTCAGCTGCCTAACAGCACTGATGAAGAGCCGTTAAAAGGCGCTCAAAATGAGGAGAGAGGTAGTTTATTATTTAACGCAAATTTAATTTAATCGCATGTTTAAGTACAAAACAGAAGAGGAATTGGGCAAAATGACGGCAGCTGAAAGAGATCAGTATGCAGTTGAAAAAAGGGAGCACGAAAACAAGGAGCGTAAGGCTGACATTGATAAGGCTCTGGAAAAACAGAAAGAGGCTTTCGATAAGGAGATTGACGAGCTAAAAAAAGCTAATGAGGAAACTCAAAAGCACGCTGATCAGTTAGATATTCAGCTTAAAAAACAGGGTGGATTTGTGCAGCCAAAATCGTTAGAGGCTGTTATTACTGAGGAGAAAGAGCACTTAGTAAAAGCTTCTAAAAACAAAGGATCAGAGCATGAATTTTTAATTAAGGCTGATACCTTAAGGGCTTCAGTTGTAGGTAATCCGTCAGCTTTAGACTTGGACTCTATCGGACAGATTGGGCACAGAAAACTTACATTGTATGATTTGTTCCCAAAAATCCCAATTGGCGAGGGTAACAACGGGGTTGTGCGTTATGTTGATTGGAACGCTGCAACAATCACACGCGCAGCTAAATCGGTAAAAGAGGGTGAGTCTTTCCCAGAAAGTACCGCTAAATTCGCTACATACACTTTGGATTTAAAGAAAATCGGTGATACAATCCCGATGTCTGAAGAGCTTATTTACGATGCTCCACGCTTCGCAAAAGAGCTTAAAATGTTCTTAGAAACTAACGTAGCGATCAAGATCGATACAGATTTGTATTCTGCTGATGGTACAGGTGACGAGATCAAAGGATTAAAGGCAAGTGTGCCGGATTATACCCCTGTAGCTTCTGGTATCGAAGATGCTTCAATCAACGATTTAGTTGTAAAAGTTTCCGAGGACATTACTACGGATAAAGGATCTAAATACGCTCCAGATTTCGCGTTGATGAACATTAAAGACATCAACAAAAGAAAGCTTAAAAAGGATGCTAACGGTAATTATATCATTGTTCCATTCGCGAAAGACGATAAAATTGACAACATGTTAGTTGTTGAGTGTAACGCTGTTGCTGTCAATGAGATGATCATTGGTGACTCACGTTACGGGGCTATTTATGAAGTGCCAGGCGTTTACGTTGCTACAGGATTAAACGGAACTGATTTCGGTGATGATATGCAGACATTAAAAGCTCGTAAGCGCTTAAATCTGTTGATCCGTAATGCTGATAAAACAGGATTCAGACGAATTACCTCTATCAGCGCGGCATTAGTTACTTTATCTGAAGTAGAAGCAGGAGGGTAGTCATAATGGTTTGGGTAGAGTTTACTAAAAAATTTGCTACCAAAAACAAGGGTGACAAATTAAAATGTGATCGAATGCTGGCTAATCAATTAATTGTTGTGGACAAAGTTGCAAAACTAACCATTGAGCCAGATAAAGAAAGCACAAAATAATCTTAATCCCTGCTTAGATCAGATCGGCAGGGATTAACAAGCTCTCGGATAGTATAATGGTAATACAACAGATTTTGGTTCTGTTTATCTAGGTTCGATCCCTGGTCTGAGATCTAAATTTTAATGTGATGGCTAAAGTAAGAGTGATTGCGAGTACTATCAGATATGGTAGTAATGGCTTTAAGCACAAAGGAGATACATTTAATCTGCCGGATGCTGAAGCAAAGGATAAAGCAGCTAAAAAGCTGGTTGAAATTGTCGAAGAAACTAAGGCTGTAGAGCCTAAAGTAAAAATTAAAACTGAAAAGTAATGTTACCCACACTGAGCGATTGCAAGTCTTACGCCCAAATCGATGCTGATTATATATTAGATGATGGGTTGATTAGCGATCTGTTGAAAGCTGCTATATCATGGTGCGAGCAATATACAGGGCTTTTGTTTACAGAGCAGGAAATAACTGAAACTAAGTTGCTACGCCACTTTAGACTAAAAGCGCCTTTGATTTCCATCACTTCAGTAAAAGTTTTAGACGAGAACGTTGATTATAATTTTACAGGTGAATGGGTACGCTCTGTTAATGGTGTTAAAACTGTGATATACAGGGCTGGTTATCCGGAGAACACTTTACCAGAACCAATCAAAACGGCTATCAAATTGATGGTTCAAACGCTATACCGTAACAGAGAGGATTATATTGTAAGTGATGTCACAAAGGCCATAAATCAAGTGCCTATTGGTATAAAGGAGTTATTGTCTCCGTATAGCATATCTGGAGGGCTGTTCTTATAATGAAAAGAGATCGTATTAAGGTTTATTCTTTAGAAAGCGTACAGGACGCTGGAGGCGGCTTTAATCCCGATCAAAGAGTGCTCTATTGGGAGACTGCCGCCACTGTTAAGGCCGCAAAAGTTAAAAGAGATCTCCAGAGCTATCAAACGGATTTGGAGATCCCGATGGAGTTTAAAGTGATGTTTAGACGAGACAAAAATGTCACTAAAAATATGATCATCTCTTATGAGGATCAAGATTACACGATACACAGCATTGTTAATGTTGATCAAGATAGCAAGGATTTACTACTAACAGGGATTACCAGGGCATGATAGATGGACTCAACAAGGCTTTAGAAGATCTACAGGAGCGTTTTCTTAAAATCGAGATGAACGTAAAAAAAGAGATCGGAACGACTGGAGAGAAAATAAAATCTGATGCAAGTGTAAACGCTAGCGCCATTGGGTTCTTTGATTCCTACGGTAATTGGGTAGAGTTATCTGGCAAAGTTAAGGGCAATGCCTTTGAGGCCGGTAACGGCTATCGTATCTGGGTGAATGCTGGGGAAATGGCGGCTTATATTGAGTTTGGTACTGGTGAATACGCAAAGAACGAAGTGGGGGCTCGTCCGCAAAATTGGAGAGATCTAGCGTACGAATTTTATGTTAACGGTAAGGGTGAGCTGCCAGCAAGGCCTTACATCTACCCGTCGTGGGTACAAAATACAACAGGTTTATTAGATAGGCTTAGAACGGCAATTAAAAGAAAGTAATGACAGATTTCACACCAAAAGTAAAAGCAGCATACCAATACTTAAACGTAGGAACATGGGTTGTTTACTATACCGGAATTGACCTAACTGATTACGCAAATGATGTTAAGTCTTTTGAAAGGAAATTGGAGGTGTTCAGAGCTGATAATAACCAGCTTATCACCTCTAAAACGCTAGCAAAGGATGAGTTTAAAATTAACTTATTATTTAGAGATGGCCAATACAATACAGATCCTATCCTAAATGATTTACCTATTCGTGTCGTACTTACACTCACGAGAGATGGACAGACTAAGATAGCTGAGGATATTATAGATTTTGTATCGGTTGACCAAAATGCAGCCCCAGCCTCCATTTATTTGTCTCTCTTAAGCGATGGTTTTAAAATTTCGGATAGTAATTCATATCCCATATTTAACAATAAAGCGCAAGATGATTTTAGCCGCTACGTGGTCGTTTCGCGTAGGCCTACAGACGAAAGTTCAGTAAATAAGATCGAGTACGTTAAAGAGCTTGTAAATGGTGTCTCGTCAATAGATTTTGATTACTTCAATGAGTATGTAGTAGAGTTTGATGTGTTATGGATAAACAAGGTTACAAATCAGCTTTACGTTGCTCATAGCGGTAACTATGCAACGAACAATCCACTTTTAACATCGCTTTACAATGCTGGTGGGAAATATGTAGGATCTGCTGGTAAAGATCCTTTAGCTTCTGAGGACTTAGCGCCTAATATGGGTGTAATTGATCCGTCAAATCCTGAGCAACCAACTAGCGGAACGGTTTTAAGGGACGTAGTAGAGCCTCTAAGGATAGCAGTTAGAGCAAAATTATTAAGTACTTCAGTGCCTATTTATGACGCTTTTGTGCCAGATTCTGCTCCAGATTCATTTATCGTCATCAAAGATATAAACGAGGCTGATGATAGCTTAAAAAGCGTGTTTAATGGAGATGTTCATGTCACTTTGGATATTGTAACGAGATTTCCTCAAGGATCAGGTACAAGCTCAAAGCGCGATCAGCTTACAGGTCAAGTTTATGAGAAACTGATACCTAACACGGTTAAGATAGATCATTTTCACATTTTAAATGCTGTAAGGACGCTTTCCAGGCCGATAGATGAAGATTCTAATCAATATAAAATATTACGCAAAATCATAATTATCAAATACAAGATTCAACAATTAAATTAAAAATTAAAGAGAGAGGGAAAAAGTGAGATGGCAGATTTAAATTTTAAAAACGGTACGGATAACGTATTATTCGTAAAAATTGGCGCTCCTGCTGCGTGGGTAGCGGTTGCGTGTTTGAAGACAAACAGCTGGGATGGTTCGACTGATCAAATTGATACAACATCTAAATGCTCAGGAAAATTTAAAACTTCATTACCTGGGGATATTTCTTGGTCATTTAAAGGTGATGGAAACGCTGTAGATGATAGTGGAGCGCCTAGCAAAGCATCATTTAAAGCACTATCTGCTTTGCATAAGGCAGGAACAACATTCCCTTGTAAAATGGTAGGCGTAGACGATCCAGATGATATCATAAGAGGTGATGTTTTTATTACCGCTTTAAGTCTTTCGGCTGGCCGTAATGAGGCCGTAGCCTTTAGCGCAACGTTTCAAGGTACAGGCGAATACTTCACAACACCAGAGGCGTAATGAATACAGGCAGAATTAGTATTGAGTTAAGGGGAAAGTTACCCCTTTAACTTTCGGGATGATGGCTATTGAAGAGTTTGGGAATAGACAGGCTATCGGTAATGCTGGCTGGTCTAAATTGATGACAGATCTAATTTACTCTGGCTATGTCAATGATCAAATTGTTGAGGGCTTACCTCCAATCTTAAGCTACCGTGAAATTGCGGAGGGGGTTGAGGCAATGTTATTAGCAAAAGATCCGGTTCTGGGAGCTGTTTACAAATGTTTCGAAGAAAGCCAGGCAGGTTCTCAGCTGATGGATGACGTAAAAAAAAAACTGATGGAAACGGTAGTGCCAGAAGCAAAAAAACGTCAAACAAAAAAACCGATTGGCAAAAAGTAAAAAGGTTTGCTTTTGGTGAATTAGGATTAAAGCCTAAAGAATATTATGCCCTCACACATTCGGAGTACAACCTTATGTGTGAGGGCTATTTTGATAAAGAGCTAAGAGCGTGGAAGCGAACAAGGTCTTTAGCATGGACTATAACCCTGGGTTATGCAGATCCAAAAGATTTACCAGAAAACCAACAAGTTTGGTGGCCAATGGCAGGAGATGTAATGCCAAAGCGCCCAACAGCAAAATTAACAAAAGCAAAGCAGAACAAGATTGCTGAAAGAATTAAGGCAGAATTAGAGAGGGGGAAAGCAAGTGAGTGATGCAATGTTATCCGTTGAGGTGATAGCCGAAATGGAGTCCTTAAGCGTAGGCTTAAAAAGAGGATCAAAAGATATTTTAGATTTTGTTACGGGTGGAAATAAAGCCCTCAAAGATCTTGAAAAGACATTAAACGGTTTGGGGTTGGACTCTCAAACCAAACCATAAAAAATTTAACTGCCCAGTTAAAAGAGCAGAAATTAGCCACAGAGGCTAATAAGACAGCTACGGAACAGAACAGAGCAGCTACCGAGGAGGGTAGGAGAGCTGTGCAGGATGCGACTGCTGCTTTAATAAATCAGCGAACAGCAACTGAGGCTAACAGGGCGGTAACAGAAGCCAGCCGAACATCTACGCAAAATGCCACTAATGCCCTTTTGCAGCAGCGTACTGCAACCGAAGCGAACCGAACAGCCAACGAAGCTGGAAGATTAACCGCAATACAGAGTACGGCCGCGCTGAATAACCAAAGATTAGCTACTGAGGCAAATCGCACGGCATTGTCTGCGCTGAGACTGCAAAATGCTCAAAATACCAATACAAATAGAGCAGCTTCCGGAAGTTATGACGAAATGAGAATGCGGATGAACGCATTAGGCAGGCAAATAAGAGCTACAGCTGATGGATTTAGCTCAACCAATACGACTATCAGGGCTCAAATAGCTGAATATAATAGGCTAAATGATGCCTTAAAAAGATTCGACGCGAGCATGGGTAACCATCAGCGGAATGTTGGTAATTATGCTGGTGCTATGGGCGGTGTTTTAACAACGCTATCAGGAATGGCCGCAGGATTTCTGTCGATTCAGGCAATTCTATCTATGTCGTTTGATACTGCTCTTAAAACAGATGGTATTAAAACATCGCTTGAGTTCACATTTGGTAGTGTTGACGCAGCAAGATCTAAAATGGATGGGCTGAGGGTTACCGCGAATAGGTTAGGTATTGAATACGTCAGTCTAGCTGATTCTTACCGATCGTTTGCCGGAGCTGCTATTGCTTCAAACTTCCCATTACGTGAGACAGATAGGATTTTCAATGCTGTTGCAAATGCTGGAGCAAAACTTAAGCTTAGTAGTGATCAGATGAGTGGAGCATTGACCGCATTGCAACAAATGATCTCTAAAGGTAATGTTCAATCTGAAGAGTTGAGAGGGCAGTTAGGTGAGCGTTTGCCTGGTGCGTTTGCTATTGCGGCTAAAGCAATGGGGGTAACACAGCAAGAGTTGGGCAAGCTTTTACAGGACGGAAAGGTTTTAGCTGCTGATTTGCTACCGAAGTTGGCCGATGAACTGGATAAAACGTTCTCAAATGATAAAAATGAAAAAGTAGACAGTTTACAAGGCTCAGTAAATAGGCTTAAAAACTCTTTTTCAGAGATGGTTGAGACAAAAGGGGCTCTAAGTGCATTTTTCGCATTTGTTGTGGATGCCGCTGGCGGTGCTCTGCAAGGCTTAAACAAATTGAGTCAATCTTTAGGAGTATTTTATGATTTGGCCACACATCCAAAAAAATTCATCGGAGACAGTGGAAAAGCAGCATGGGATAAAGCTTTACAGGACATAAGCGAAAGGGCTGAGTCATCTGCAAAGAAAGTTTCACAAAGCTCAAAAGGAATTTTGGTGAGCTCTTTAAATGACGCTATTGCTGCTCAAAAAGGATTGAGTGATGCGTATAAGGCAGCGCAAGACAAATACAAAGCCGGAGGCGGCAACTTTGCAGATGCTAAGGCTGAGAATGAAGCAAAGCAAGCACTGCAATATCAGATCTTATTAGTTAAAAATTTGAGATCAGAATATGATAGGCTATATGGGGCAAAAGGCAAACAAAAAGAGGTTGATGATGCTAATTTAACATCTGTAAAAGAGATCCAGAAACGGATAAATGACTTAAAGGCGTTAGATGGATCTGCCATAATTGGGAGCACCATTTACAATAGAATTAAAGCCCTGCAGGATATGCTTGCTAAGCCGAAAACAGGGAAAAGTGACGAGGAAAAGGCCGCTGAAGCGAGAGCGAAAAAGATAACAGCTCTTTATAAAGATCTGGAGTTACAGCTAGCTAAAACCGAACTGATCCAGAGAGATCTCATTTCTGGAGGAGATATAAAAAAGTTTGACGCGTATCAGGAAGCGATTGAGAAGCTGACTAAGTTAGGCTTTGAGCCCTTGAGTGATGCTATACAGGATCTGGCGGAAAAACAAAGCAGATTGGTAAATCTGAGCTTACCTAAAATGATCACTACGAACGGTCTTTTAAATGATCCTAAGTATGATAAAACAAATCAGTTTAAAGATAGCCCATTGCAAGCAGACACCACTATTAAGAGCGTTAAAGTTGGCACTGATGCCTTTTTAGCTGACTTAGAGAGGAAAAAGCAAGCATTTAAGAGTTTCAAAGAGTCTATGGCTGAAACTGTCAATTCGTTTGTAGCGGATGTTGTAACTGTTTTTGCACAAGGCGTAGGTGAGATGATGGCTGGTGATATGAGTTTTGATGATTTTGGACGTACCATTTTAAACTCTTTTGGTCAGTTTTTAGCAAATCTGGGAAAAATGATGGTTCAGTACGGTACAACAGCGCTGCTGATGGGGGTTCTGAGTTCTCAATTAACCAATCCTATTACTGCTATTCCGGCAGCTATCGGGCTTATTGCCGCTGGTGCTGCTCTCGCAGCTATTGGATCTGGTATTAGCAGTGCAGCTGCTGGAGGGAGTTCAAAAGATTCTACAGGATCTGGAGTTAGTAATGTGCCACACTTCGCTAACGGTGGCATAGTTTCGGGACCTACTCTGGCTATGGTTGGAGAATATCCGAACGCAAAGAATGATCCGGAGGTAATAAGTCCTTTATCAAAGCTTAAAACTTTAATAGGCGCTGGAGGAGGTAATAATCCCAGCTTTAATATTGTTCAAAAAGTATCAATGGGAGAGCTAGTGATAGCGATAGAGAGGCAGAAGAAAGCAAACGGCAGGGTATAAGATGAAAGAGCGCCAAATATTAACGTTTGGCGCTCCCTTTAAAACTCTGATATACGTTTGATGTTTAGATCAAAGGAGCTGGTTAAATCCTTATCTAAAATTGTTAAGGTATTGATAGCTAATTCTTTATTGCTTATCTTGGATCTTTTATTTGTCGTTACAGCTTCTGAGAGTTCAAGATCAGATTTTGCAAATGTAATCGGGTTCACTAATCCCTTAAACGCCATATCAAAAATACTGATTCGGTAGGCGCTATCTTTCACTTGAATAATAACCTTTGCTGCTATTGGGTACTTCAGTAGAGCTCCAGAGCCTAAAGATGATCCACCAAACATCTTATAGTTAACCACATAATCAATTAATTGACCACTAATCTGTTTGTCTGTCTCATTTTCCAATTTAAATCCTTTGGTGGTAGTAAGAAAATTTTTTAACTCCATTAATAGATCAGGCCTTGATTTATCAGAGGAAAATACTTTTTGATAAATCAGTGAATTGTCTTTTAAAACTATTGATGTGCCCAACACACTGTCTTGTACTCCAGCACCTAAAATATCTTTCTTATTCCCAACCTGGGAATAGGATAAGATAGGCATTAGCAGTAGTATTAAGGTTATCGCTCTCATTTTACAATTTTAAACAAACCATAAGTAAGAAAAAATAAAATAAAAATATTCATATAAGGATAATTTACATAAAATTACTAATTTTACATCCGAGAGAGAGATGTAATGGCGTACGGGGTAAATTTTAGATTAAGCTTTTGTAACAAGGAAAATGATCCTTGTATTATTGAGATCCTAAAAAAGGATTACTATGGCTCTGTAAAGTCATTTGTAGGAGGGGGTGAGCCAATTTCTATCACCTATAAAAATGTCGAAGAAAGTAAGTTTGATCAAATAACTGGTAGCGAGGCAACTATTGCTTTAGTGACTTCGGATGAGCTTTCATTGAAAGAGTTTTATACTGGTGATGAAAGAGAATGGCAAACAAAACTTTACATTTCTGGGGAGTTAAAATGGTCAGGCTTTGTTATGCCTGATAGTTCTAGTGAGCCATTTAGAACGCCACCTTATCTGGCTCAATTAAAAGCTACTGATGTCATCGGTAGCCTTAAAACCGTTCCTTATAGCAATGGGGGACAATTAATTAAAAAAGTCGATTCGATAAAAAACATCATAGCTGATTGTTTGTCGAGAACGGGATTGGATCTGGATTTTTTCATTGGATTGAATGTGTATGAGGCGAACTTTTTAAAAGGCTCAAACGATTGTCCATTAGAGCAGACCTTTGTTGATACAAACAGGTTTATAGATACCAATAATAAGCCATTTTCGTGCTTTGATGTGCTAATGTACTTCAGTAACCAGTTCGGCCTTAATTATAGGCAAGCTGGCGGTGTGTGGTGGATTGTTGATGTAGAAGAGTATGCAAAGGATAGCTTTAGAGTAAGAAAGTTTAATAAATCAGGTGAAAAACTAGGCAATCAATTGATCTCTAAAGCTCTGAACGCAGGTTATAAAAAAGAGATTCAGCTCGTTAATGGAGACCACTATGACTCAAATATTGCAGCTTATAAGGCGGTTACAACCTACTATCAATATGGATATTTAAGCAGTGAGCTGTATAACGGAGATTTCAATATTAAAAAAACAAATAATGTTGAACTGTGTCCTTTTGTAGGCTGGAATAGCCTGGGTAATCTGCCTATTGGATTGGGAGAGAAAACCTCTAAAAATGTGGCTGGCACTGACGTTCCAAACGGAGATCTGTATGCTGTCTTAATGAATTACACTAGTACTCATGAGCCTGATTTTAATAAAGGAATTTATTCAGATCCTATTACAGTATTAGGTACTCAAAAGATAGGGATAAGTTTGGATGTAGGTGAGGCGCAAAGTCAGCCAGAGCCCTATGACGGTTTAACTTTCTTTTTTAAGATAAAAGTATCAGCTATTGGCAAATCAGACAAGTCTATTAACATTGATAACGGTTCTACAAAATGGAATAACAATGGCAACGAGATTTGCTATTTATATGCAGGAGGCACGGCTAATAAGACTATCAAAACATTGTCCCTGACTTTACCAGAGGTAGGTTATGATTGTCAATTAACGATTTATGTTTATGGAGGTAACTCCGGAACTGTAGACGGCAAGAGTGGAAGCGCCAGAATTAGAGCAGGGATGTTTTTAGATAACGTAAAGGTTAATCTGCAAGAAAACGCTGTCCAAAAGTCATCTATTGGCAACGTAGTAACAAACACACAAGTTTATAACTACTCGCAAACTAAGGAGGCAGTAGTATTACTTTTTGGGGATGACGGTGGCAATCAGCAGAGGACAAGTTGGCTGAGAAATTCCATAGGAGATCCAACCACTTTGTGGGGGAAGGCCTAACCATTCAGCAGATAGCGACCAGAAAGCTATTAAATCAGTATCAAAAAACATCCTCAATGTTTGAGGGTACTTTTAAGGGTAAAATAGATGCAGTTAACACATTAAACATTGATCTTACAGACAGTAAGTTTTTTATGCTGGCTGGAACGTTCTATGTTAAGAGCTCTGAGGCTAAATTGACCTTAGCAGAGGTGTTTACTACTCCATTGGATCGTAAGTATGTTAATGAGGATATTTATGAGGATTTCGGTGAATATAAGACTTCAGACGGAAAAGCTGTAGGTAGCGCAAGTGGTGTAACTCTGCCATCGACTCCAAATCAGCAGCAAAACGCTGCATTTATCAACAGGTTAAGTGAGCGAGATGAATATCTATATTTAGATGGAAGCAAGGTAAAAGCTGGCACAGCTGACTATTCAACAGATTCTGGCCACGCAAATTTTTCTGATTATGCAACCAACGCAGGGCATGCCGTCAATTCCGATCGGGCAGTTTTGGCTGATCTTGCAACAAACGCCATTCATGCTAATAATGCAGACTATGCCATTGAAGCTGGTCATGCCTCGTTAGCAGATTATGCAAAAGATTCTGATAAATGGGATAATAAGCAATTCGATGACTATTTAGATCAGCCTTTGCGTAAAACTGATGCCGTCAAATTTGCTTCTGTTGTGGCCGATACGGTCAACAGCACCGTTTATGTTAGCGGTTTTACAGGTTCAGGTTATCGTATTAATCCTGATGGATCAGCCGAATTTGATAGTCTTACGGTTCGTAAGGAATTAAATATTAACGTGCTTAACGTCCGTGAAATCACAGGTAGCGGTGGCAGTGTAGCAATTACCAATGTTGCCAAAATCAAAGATGTTGTTGAATGGGATGATTATTATCAGTGTAATATAAATACTGATGACGGCACAATTACGGTTCAGTTACGGATAGATGATATTGTGCGCTGTCAGGTATGGGATGGTAAAAAGCTTAAATATTATTCGGCACGGGTACGTGCGGTAAGCGCTGGCATATTCGATTTAGATAAAGCTTCCTTTGTAGGTGGTGGCAGGCCTGCACCGGGCGATACTGTTTTCCAGTTTGGTAATGCCACCAATGCCGACCGTCAGGGTTTGATTTACTTGACTAATAGCGATACAGGCGCACCGTATTTGGATGTTTTGGATGGCATAACATCCGATAATTTGGCGGGTAAAACAAAGGTTCGTTTAGGTCGGCTTAATGGCATTAACGATGTTGATTTAGGGCAATTGGATGGTTACGGTATTTATGCCGAACGTGCATTTATCAAAGGCAAAATAGTTGTTACGGGCGGTAATGCTGAAACGGTTACAGGCTCGCAAGCAAAAGCAAATACAGCACAGGCGAACGCAATTAATACCGCTTCGGGCGATGCAAGCGTAAAGGCAAACAATGCCCAAAACAATGCTATTTCCGTTGCATCATCTGACGCACAAAATAAAGCAAATGCAGCGCAAACGGCGGCGGCTGGTTATACTGATAGCAAAGCATTAGCCACTATTTCGGCAGCTCAAACTTACGCCGATAATTCGGCCACAAGTAAAGCGAATGCAGCACAAGCAAATGCGATAAGCCAAGCCAGCACAGATGCGCAGAATAAAGCGAATGCGGCACAGGCAAACGCGGCATTGTTAAGCCAACAGCTTGTAGACGGCATTAAGGTTGGCAGTAGAAATCTTATTTTAAACAGTAATACGCCAGTAGAAAACAATGCTTATAGCTTGAATGTGTATAGTCTTGCCATGAGTGCTGTAGTTGGCGAAACGTATACCTTTTCAGCTAAAGTAAATTTAAGTGCTGGTCAAACAGGTATTTATTTAAATGTAATTGATTATGTCAATTATCCTTCTATAGCCGAACTTGTTTACCCCGATGCAGACGGGATTTTCAGAAAGACGTTTGTTATGCCTAACGGTGCTACAAGCTATAACTACATCGGGCTTTATACCACACCATTGGGAAACTACCAAACCGCTAAGGTATTTTGGGTTAAGTTGGAAAAAGGCAATAAGGCTACGGACTGGACACCAGCACCCGAAGATGTACAAAACGCAATTGATACCGCAAATGCTTTGGCTAATGCTGCAAACGCCTCTTATGCAAGTTTAACCGCAAACCTAAAATCTTTGGCTTATGCTGATGTAGTAGAGTTGGCGAAGCTTGGCACTACCATTATTGATGGCGGTAAAATCAAAACCACGTTATTGGATGCAGATTATATCAGGGCTAATGTCATTAATGCTGGTTATATCAATACGTTGGAATTAGATGCAACCGCAATAAAATCGGGAACGATTGACAGCGCAAGGATTAACGCAAGCCAAATTATTTCAAATGGTGGCGGTGCAACTACGGTTCAATTAAATCAAGCCAAACAGGATGCTGAAAACGCAGCAAAAGCCTACGCAGATGCACAGGACAATCTTAAAAAAATAGAGGCCAACGCTTATGCCGATGGTAAGGTAAGTGCTGAAGAGCAAAGGGCTATTAATGATGCAATAGCAAAGCTAAATGAAGCAAAAGCCGATGCTACCGCAAAAGATAACGCCGTTAAAACCTACGCTGACAATGCCAAATTAGAAGCTATTACCACGGCCACGACACAAAGTGCAGCCGACGCTACAGTTAAAGCGAGCCAAGCACAGGTTATAGCAATACAAACCGCTGCTACCGATGCGACACAAAAGGCAAATAACGCTATAGTAGCAGCATCAAATGATGCCACCTATAAGGCAGAAGAGGCAAAGCGATATGCGGAAGCCAAATCTTTCATGTCGGGTAAAATGCTAAACCGTGATGCGGATTTTAGGGATGGCATTAGCGGCATGGCTGTCTATAACAATTTGGGAAATGGAAACGTAATTGTTGATCGCTTAGATCGTTCGTATTGGGGTGATGCGCAAAATGCATTGCCCACAACTTCGTCTTGTGGCGTAAGGATAAAAAATATCGGAAGCGCATCGCCTGGGCTAGGTGGATTTTATTTTGGCACTCAAACAAGGGCTAACGCAAAATTCGTTACTAGACTAATTGCAAACATACCAGTTGGCTATACAATTCATTTTCATTCAAATTCTACAGGTGATGGTGGTTACGGGTATTGGGCTACGCCAGTTGTAGGTACAGGAACATGGCAGGAATATATTTACGTTTTGCAGTGTGGTAGCTCAGGTACATTTTCAAGTACCAACTTTTTTGCATTAGATGGCAATAATTACGGCATGGAATGGCATTTAGCCTACGCAACTGTTTTTGATGTTACGGATAGCGAAGTAAATTATCTAAAGGATGCGCAGGCAAAAGCAGATGCAGCACAAATTGCGGCTACAAACCTTGCTTATGCTCAGGCAGCTTACGAGCGTGAAGTAGCCAAATCATACGCTGACGGAAAGATAACAGCTGAAGAGGCGGCACGCATCGCGCAAGCTGCCACAAATCTTCAAGTGGCTAAAGATGATGCAACAAATAAAGTTAATGCGGCATACGCCTCTGCAAATGGATATACCGACACTAAGACCCAACAAACATTAGTTGCGGCACAGACCTACGCCGATAATTCAGCGCAGAACAAAGCCAATATTGCGCAGTCAAATGCAATAAGCCAAGCCAGCACAGATGCACAGAACAAGGCGAATGCGGCACAGGCAGCGGCAAACCTGTTGAGCCAACAGCTTGTAGATGGCATTAAGGTTGGTGGTAGAAACCTTGTTTTAAACAGTAATACGCCAGTAGAAAATAATAACTACACCTTGAATGTGTACAGTCTTGCGATAAGTGGCGTAGCTGGCGAAACGTACACCTTTTCAGCCAAAGTAAATTTAAGTGTGGGACAGGTAGGGCTTTATTTAAATGTAATTGATTATGTCAATTATCCTTCTATAGCTGAGCTTATTTACCCCGATGCAGATGGGATTTTTAGAAAGACATTTGTTATGCCTAACGGGGCTGCAAAGTATAATGAAATTGGGCTGTACACCTCTCCATTGGGCAACTACCAAACTGCTAAGGCATTTTGGGTTAAGTTGGAAAAGGGTAACAAGGCTACAGATTGGACACCAGCCCCCGAAGATGTACAAAACGCAATTGATACCGCAAATGCTCTAGCTAATGCGGCAAACGCAAGTTACGCCAGTTTAACGGCAAGCCTTAAAAGCTTAGCCTATCAAGATGTAGTAGAGCTTGCTAAACTAGGAAGTACTGTTATTGAGGGCGGTAAAGTCAAAACCACATTATTGGATGCCGATTATATCAGGGCTAATGTCATTAACGCGTCTTATGTACAATCGTTAAATGTTGTCGCGACAAATATCCAAGCGACTACCGGATCTATTGGCGGTTGGAATTTGGGATTAGATAGGTTGTTTTCCGGATCTGAAAGCTCGAACTATATCGCGTTGATTTCTGGTAGTTCGCCTGAGTTATACATGAAAAATTCTGATCAAGTCAGTGGAGAGTATAGCAGTTTAAACACAAAGGGCTTGTATGTGATGAGCTCTGGAAACTCATTGCCATCATCTTACGGCTACACTTATGCTGTGGGGGCTTTTAAGCTAAAGAGTGGTTCAGTTGCCAATAGTGCGGCTTTGTATGCTGGAGCGCCAAATGATAGGCTTGCTTTCTATTGTGACGGATCTATGTATGTAAATCGAGATGCTTCTTTTAACGCTTCCATCGTTATCAGCGGTAATGCGTATTTCAATACAGGATTTATAGTTATGGGCAATTTGCCAAATGCGAATGATATGGGGATAATAAATAATGCAAACTCTGGAGGGGTTAGGGTTGTGACAGCAGGTGTTAACGCAGGGAGATTATATAGAGCATAAGATGAAAGTAACGATAAAAGACAGGCTTATTATTCAAGGGGTTTTGATTCCTTTGATGCCAGCAAAAGGGAGTTTTATAGAGATGATTCATATCTCAAACATTAAAGAACAAGCGCAAATAAGTATCGAAGAGGTTAAGAAGTTCAACTTTAGAGATCTTAATAACGGTGAAATCACATGGAATGACTCGCCAGAGTGTGATAAGGTATTGGAGCTTTCTGCGGAGCAAATCGATCTGCTTCAGCTGGCAGTTTATGCTTTAGATGAGCAAAAACTGATCACAATGGATCTCCTTAATACCTGTGAAAAAATATTAAAATTAACAGAAAGTAAATAAACAAAAATCAATTAAAAATGAGAAAGAACGCAAAAACAGTAACAAAAAATTACGACACTGACACGGTTAATGGATGGAAATTAAGTTATGAGTATGAAAGCGAAAACGGTGCAGCTCCGGTTGAGATCCGAGTAACTGGATCAAAGGATGCAGGTAGCGTATTCATTACGAAAACTGGAGCGAACACCTCTTTTAACTTTAACGGTGGCTCTACAGATGTAGCGGTGATCTCAAGTGTTGAGACGGAGATAAGTGAAATATTAGCAGGTTATACAGCAAATCAATAAGATGAATTTAACAAAGAAGCAAATCAGTGATGTAGCGGCAGGGATAGGTGTAGATTATGCTTCCTTGATGGCATTTATGTCGGTTGAGTCTGGCGGTATCGGGTTCGATACTGCTACAGGCAAAATAATTATTCAGTTTGAGCCAGCTTGGTTCAAGAAAAAAGCGCCTTATGCCCCGTCTGGGTTATGGTCGGTTAACAAAGTTGAAAAACAATCTAAAGAGTGGTTAGCCTTTAATGATGCTTATTATAAGAATGCAGATGCAGCAATGGAAAGCACTTCGATTGGTATAGGCCAAATTATGGGCTTTCATTTTAAAAGGTTAGGGTACAAGACTGTAGGGGCTATGTGGGAACACGCGCGCACGGGTGAGTTAGCTCAGCTGGAGCAAATGGCAAAATTTATTGCCACTGATTCGCGATTGCTCAACGCTTTAATGGTTAAGAATTGGCATTTAGTGGCAGTCTATTATAACGGAGGTGGTTATAAAGAACTTGCCGAGAAGTATAACAGAGAGCCATATAATATCAGTATGGAAAAAGCTTATTTAAAATACAAGTAACATAAAATGGCTGAAAGCACACAAATCAAAAGAACGACTAAAAATACAAATACTTTAACCTGGGCTTTAGGAGCGCTGACGAGTATAGCAACATTTTTTGCTGCTTATAATCGTCAGATGTGGAATGATTCGGAGGCTAAAAATGCTGCTAATGTTTTGTATTATCAAAAGCAGCTGTCTATAATGGATGAGAAGCTGGAGCAAAAGGATAGGGCTTTAGATAGTGTGCAGGGATTAATGTTGAAGCGAGCAGATAACTCTTTTGAGGAATGGAAAAGAATGCTGGCTATCGATAGTAATCGTAAAAGCACTATAATCATTAAAACCAACAAGTAATATGAAAAAGTTAATACTTTTAGTACTAGCGATTGTTTTAATAGTCCCTAGTAATGGCTGTCGGATCTTGAGAGAAAAAGATAAGCATACATCACTTGCAAAAACAGATGTAATGAATAATGTAAATGTTAGTAAGCAAACTATTGATAGTCTGGTTGCTTTTAAGAACTATATTTACAACCGGAGTTCTCAGGTAATTTCTGAAGAAATCAATTACAAGTTTCCTAATACCGACAAAAAGGATTTGGAGATCACTGCTAATTTTAGAGTAGACCCTGTTATCGATTTAAAGGGCGATACGGCTTTTAAGCTGGTTGATGTTAAAAATGACAATGTTAGTGTAACTGTATATCAGAACAAGCGCACTAATGAGTTGATGGCAAAGGTTAAAACAGAAAATGGGATAAAAGAACTTAAAGCAAGTGAGATCCAGATAAAGCGAACCACAACGACTAACAGCGATGTTGTTGATACTTCGAAGAAAGATATTGATGTTAAACGATCCACGATTGATAGTGTTGATAAATCTAAAAGCTCAACATACAAAAAAGAGGTTGACTTACAGGTTAACAAAGAAGTAAAGTCAGTATTTTTGGGCTGGTGGTGCGTGTTTTTAGTCATACCATTGCTGATTATCATATTTAAAAGGAAAAGTATTTTAAAGTGGATTAGAAGCAAAATAGCTTAATCAAAGGCCTCTCTTTATTGGGAGGCCTTTAAGTTTTCTAAAACTTTCTCAGCATACTCATCCATAACAAGATCGTCGGATATTTCCGAGATATAGCCCTCATGAATAGCTAACGATGAGTGTCCAATAAGATCCTTTGTGATGCTGGTATCTTTTATCGTTGAATTGGCAATTTTCGAAAAAAAGTGACGAGCCGCATGTGGAGAGATGTTTTTTGTAATTTTTATTTTCTCTCCGATAATCTTTAAGTATCTGCTCAGCTTCGAAATGGCATTTTTTACCGCTTTTTTGTATATAAACTTATCAACGTTCGCGTCTGTGTCCATAAAGGAAAAGATATAGTCAAACTCATTGCCGACCATCCACCTATCAATAATATTTTTCAGAGCCTCAACAATTCCTATGTTATGAATTTTGCCGGTTTTCCGCTCTTCATAAACCAGGCGATTATCAATAATGTTTGATGCCTTAAGTGTGATTAAATCTCCGATTCTAATACCTCGTAAGAATATGCTGGCAATGAAAATATCTCTTGACTCAGCCATTTTACCAGATAGTTCCAAACTCATTATCTGTTGTATTTCACTAACATTTAGCTTAGTCTTAGTGGATCTCTGTTTATTAAAAGTTATATCGTCCAGAGCATTCTCTTTAATCATTTTGGCTTTTTTAGCTCCAGATAGAACTTTGCCGAGAACGTGCATTTTTTCCTTTATTGAGTTAGGATTGTTTTTTTTTACGTCTCTTAAAAATGCCGCGAATTTATAGATAAATGACTCCGTAATGTCCTCGAAATCGACATCTTTATCAAACTCAAGCAGCTGAGCAAGTACAACTTTATTTACATCGTGCCTAGAAACTTGTTCTTTTAGCCGATAATTTTCTATTATATTTTCAAAATAGGCTTTAAAATTTAGTACCTTAGTTATACCGAAGTTCTTTAGAGCATATTCGATATCATTGTTTATTCTCGGAGCTTCAATATTTTTTGAAGAAACTCTATTTGTGGATTTAAGCCAATCTTGCTTTTTGCAACGGCCTAAAACCTTTCTTATAGGTTTACCGTTCTTAACATATTGTAACATTATCGGATGAGTATTATCCGCGTAAGTTTTGTGAACGTAAAGAATGATTTTTGGTGTAAGCAT
Protein sequences of DBSCAN-SWA_1 >NZ_CP049868|4252513:4278017|4267439_4268027_-|WP_166210398.1|DBSCAN-SWA MRAITLILLLMPILSYSQVGNKKDILGAGVQDSVLGTSIVLKDNSLIYQKVFSSDKSRPDLLMELKNFLTTTKGFKLENETDKQISGQLIDYVVNYKMFGGSSLGSGALLKYPIAAKVIIQVKDSAYRISIFDMAFKGLVNPITFAKSDLELSEAVTTNKRSKISNKELAINTLTILDKDLTSSFDLNIKRISEF >NZ_CP049868|4252513:4278017|4253309_4253792_+|WP_166210353.1|DBSCAN-SWA MESRRKFIVIGCGSGGFSAHVQRMGGISFGKSLATQIWLNEARSIEKEIEKGLSSLNKSYNCDFTRDVIAKYAVAFHRSELAMIELIRSIVSISQSLGADSLMQSAAEQLKHLGNRGNYASDELKKMVASIQFDKAKQPNKGMSKKGGRKQKNRYPSHYR >NZ_CP049868|4252513:4278017|4261621_4262065_+|WP_166210383.1|DBSCAN-SWA MIDGLNKALEDLQERFLKIEMNVKKEIGTTGEKIKSDASVNASAIGFFDSYGNWVELSGKVKGNAFEAGNGYRIWVNAGEMAAYIEFGTGEYAKNEVGARPQNWRDLAYEFYVNGKGELPARPYIYPSWVQNTTGLLDRLRTAIKRK >NZ_CP049868|4252513:4278017|4256644_4257982_+|WP_166210365.1|portal|DBSCAN-SWA MGMLNLFKSVKKGVIDPAKGSFQLVVNGIVSWFADNKAAYLKNGYGKNVHVYVAVNVYLRKAKVAPFILSKVKSKKKLVKYDQFMQSKNQEHRLEAARLKDEALEELESHEIIDLLNKPNDYQTGVEFRESLLGFFKVLGETFVYGIAPSNGRNAGKFKELHVVPPTIIEPVYSGNILDPVSHYLIMVDGKQERIEKENVFHYKTWNPLSETGGLSPIKVGNKLLKTNDANNAAAAKAYENGGSAHLLSGKGERSLTPEQIDLLNERIAAQLKGTDNYKNIVATNGMVDVTKIGDSPAELELISADVHQRGIIASLFGVDPILVGDKQGSSFANQEQAYKALVTNSVMPDLNGIAEGLTAWLLPRFGNNLHLAFDTTVYPELQPDLELMMKVYGKPNLTPNEVRSIFKWDASKDPNMDRHYIESKMIPIEMAGTVKATGKDDEEK >NZ_CP049868|4252513:4278017|4268132_4269800_+|WP_166210401.1|DBSCAN-SWA MAYGVNFRLSFCNKENDPCIIEILKKDYYGSVKSFVGGGEPISITYKNVEESKFDQITGSEATIALVTSDELSLKEFYTGDEREWQTKLYISGELKWSGFVMPDSSSEPFRTPPYLAQLKATDVIGSLKTVPYSNGGQLIKKVDSIKNIIADCLSRTGLDLDFFIGLNVYEANFLKGSNDCPLEQTFVDTNRFIDTNNKPFSCFDVLMYFSNQFGLNYRQAGGVWWIVDVEEYAKDSFRVRKFNKSGEKLGNQLISKALNAGYKKEIQLVNGDHYDSNIAAYKAVTTYYQYGYLSSELYNGDFNIKKTNNVELCPFVGWNSLGNLPIGLGEKTSKNVAGTDVPNGDLYAVLMNYTSTHEPDFNKGIYSDPITVLGTQKIGISLDVGEAQSQPEPYDGLTFFFKIKVSAIGKSDKSINIDNGSTKWNNNGNEICYLYAGGTANKTIKTLSLTLPEVGYDCQLTIYVYGGNSGTVDGKSGSARIRAGMFLDNVKVNLQENAVQKSSIGNVVTNTQVYNYSQTKEAVVLLFGDDGGNQQRTSWLRNSIGDPTTLWGKA >NZ_CP049868|4252513:4278017|4274660_4274996_+|WP_166210407.1|DBSCAN-SWA MKVTIKDRLIIQGVLIPLMPAKGSFIEMIHISNIKEQAQISIEEVKKFNFRDLNNGEITWNDSPECDKVLELSAEQIDLLQLAVYALDEQKLITMDLLNTCEKILKLTESK >NZ_CP049868|4252513:4278017|4269856_4274659_+|WP_166210404.1|DBSCAN-SWA MFEGTFKGKIDAVNTLNIDLTDSKFFMLAGTFYVKSSEAKLTLAEVFTTPLDRKYVNEDIYEDFGEYKTSDGKAVGSASGVTLPSTPNQQQNAAFINRLSERDEYLYLDGSKVKAGTADYSTDSGHANFSDYATNAGHAVNSDRAVLADLATNAIHANNADYAIEAGHASLADYAKDSDKWDNKQFDDYLDQPLRKTDAVKFASVVADTVNSTVYVSGFTGSGYRINPDGSAEFDSLTVRKELNINVLNVREITGSGGSVAITNVAKIKDVVEWDDYYQCNINTDDGTITVQLRIDDIVRCQVWDGKKLKYYSARVRAVSAGIFDLDKASFVGGGRPAPGDTVFQFGNATNADRQGLIYLTNSDTGAPYLDVLDGITSDNLAGKTKVRLGRLNGINDVDLGQLDGYGIYAERAFIKGKIVVTGGNAETVTGSQAKANTAQANAINTASGDASVKANNAQNNAISVASSDAQNKANAAQTAAAGYTDSKALATISAAQTYADNSATSKANAAQANAISQASTDAQNKANAAQANAALLSQQLVDGIKVGSRNLILNSNTPVENNAYSLNVYSLAMSAVVGETYTFSAKVNLSAGQTGIYLNVIDYVNYPSIAELVYPDADGIFRKTFVMPNGATSYNYIGLYTTPLGNYQTAKVFWVKLEKGNKATDWTPAPEDVQNAIDTANALANAANASYASLTANLKSLAYADVVELAKLGTTIIDGGKIKTTLLDADYIRANVINAGYINTLELDATAIKSGTIDSARINASQIISNGGGATTVQLNQAKQDAENAAKAYADAQDNLKKIEANAYADGKVSAEEQRAINDAIAKLNEAKADATAKDNAVKTYADNAKLEAITTATTQSAADATVKASQAQVIAIQTAATDATQKANNAIVAASNDATYKAEEAKRYAEAKSFMSGKMLNRDADFRDGISGMAVYNNLGNGNVIVDRLDRSYWGDAQNALPTTSSCGVRIKNIGSASPGLGGFYFGTQTRANAKFVTRLIANIPVGYTIHFHSNSTGDGGYGYWATPVVGTGTWQEYIYVLQCGSSGTFSSTNFFALDGNNYGMEWHLAYATVFDVTDSEVNYLKDAQAKADAAQIAATNLAYAQAAYEREVAKSYADGKITAEEAARIAQAATNLQVAKDDATNKVNAAYASANGYTDTKTQQTLVAAQTYADNSAQNKANIAQSNAISQASTDAQNKANAAQAAANLLSQQLVDGIKVGGRNLVLNSNTPVENNNYTLNVYSLAISGVAGETYTFSAKVNLSVGQVGLYLNVIDYVNYPSIAELIYPDADGIFRKTFVMPNGAAKYNEIGLYTSPLGNYQTAKAFWVKLEKGNKATDWTPAPEDVQNAIDTANALANAANASYASLTASLKSLAYQDVVELAKLGSTVIEGGKVKTTLLDADYIRANVINASYVQSLNVVATNIQATTGSIGGWNLGLDRLFSGSESSNYIALISGSSPELYMKNSDQVSGEYSSLNTKGLYVMSSGNSLPSSYGYTYAVGAFKLKSGSVANSAALYAGAPNDRLAFYCDGSMYVNRDASFNASIVISGNAYFNTGFIVMGNLPNANDMGIINNANSGGVRVVTAGVNAGRLYRA >NZ_CP049868|4252513:4278017|4263784_4264108_+|WP_166210392.1|DBSCAN-SWA MMAIEEFGNRQAIGNAGWSKLMTDLIYSGYVNDQIVEGLPPILSYREIAEGVEAMLLAKDPVLGAVYKCFEESQAGSQLMDDVKKKLMETVVPEAKKRQTKKPIGKK >NZ_CP049868|4252513:4278017|4254821_4255346_+|WP_166210359.1|terminase|DBSCAN-SWA MRELTEKQKRFCEEYLIDLNATQAAIRAGYSIKTANEQGARLLANVSIQSYMSGRQKELQASTNITQQRVLEEYAKIAFVDIREVFETDGGIHNVKQLDDFTAGAISSIESIEEKFQGVTIGTVRKVKFHDKIRALDALGKHLGLFLADNKQKEAVNHVTVNLGGGVNPDEATT >NZ_CP049868|4252513:4278017|4252513_4252693_-|WP_166210347.1|DBSCAN-SWA MKSSELHRLIGRNGWKYLKAEGSHYIYEKDGRKYPVPYHGAKEVGKGLETKIKKEMGLK >NZ_CP049868|4252513:4278017|4264797_4267401_+|WP_166210395.1|DBSCAN-SWA MQQRTATEANRTANEAGRLTAIQSTAALNNQRLATEANRTALSALRLQNAQNTNTNRAASGSYDEMRMRMNALGRQIRATADGFSSTNTTIRAQIAEYNRLNDALKRFDASMGNHQRNVGNYAGAMGGVLTTLSGMAAGFLSIQAILSMSFDTALKTDGIKTSLEFTFGSVDAARSKMDGLRVTANRLGIEYVSLADSYRSFAGAAIASNFPLRETDRIFNAVANAGAKLKLSSDQMSGALTALQQMISKGNVQSEELRGQLGERLPGAFAIAAKAMGVTQQELGKLLQDGKVLAADLLPKLADELDKTFSNDKNEKVDSLQGSVNRLKNSFSEMVETKGALSAFFAFVVDAAGGALQGLNKLSQSLGVFYDLATHPKKFIGDSGKAAWDKALQDISERAESSAKKVSQSSKGILVSSLNDAIAAQKGLSDAYKAAQDKYKAGGGNFADAKAENEAKQALQYQILLVKNLRSEYDRLYGAKGKQKEVDDANLTSVKEIQKRINDLKALDGSAIIGSTIYNRIKALQDMLAKPKTGKSDEEKAAEARAKKITALYKDLELQLAKTELIQRDLISGGDIKKFDAYQEAIEKLTKLGFEPLSDAIQDLAEKQSRLVNLSLPKMITTNGLLNDPKYDKTNQFKDSPLQADTTIKSVKVGTDAFLADLERKKQAFKSFKESMAETVNSFVADVVTVFAQGVGEMMAGDMSFDDFGRTILNSFGQFLANLGKMMVQYGTTALLMGVLSSQLTNPITAIPAAIGLIAAGAALAAIGSGISSAAAGGSSKDSTGSGVSNVPHFANGGIVSGPTLAMVGEYPNAKNDPEVISPLSKLKTLIGAGGGNNPSFNIVQKVSMGELVIAIERQKKANGRV >NZ_CP049868|4252513:4278017|4276182_4276869_+|WP_166210419.1|DBSCAN-SWA MKKLILLVLAIVLIVPSNGCRILREKDKHTSLAKTDVMNNVNVSKQTIDSLVAFKNYIYNRSSQVISEEINYKFPNTDKKDLEITANFRVDPVIDLKGDTAFKLVDVKNDNVSVTVYQNKRTNELMAKVKTENGIKELKASEIQIKRTTTTNSDVVDTSKKDIDVKRSTIDSVDKSKSSTYKKEVDLQVNKEVKSVFLGWWCVFLVIPLLIIIFKRKSILKWIRSKIA >NZ_CP049868|4252513:4278017|4275851_4276181_+|WP_166210416.1|DBSCAN-SWA MAESTQIKRTTKNTNTLTWALGALTSIATFFAAYNRQMWNDSEAKNAANVLYYQKQLSIMDEKLEQKDRALDSVQGLMLKRADNSFEEWKRMLAIDSNRKSTIIIKTNK >NZ_CP049868|4252513:4278017|4252896_4253310_+|WP_166210350.1|DBSCAN-SWA MNAKETQKYQKKPVPALIKLATEYFNRYVRNRDAVNGRVKCISCSTLVPLLGVHAGHYRASTFAATRFDERNVNGQCARCNTHLHGNLIDYRINLIDKIGLEEVEDIEMISRMPSKWDRFDLIDIIIKYKAKCKEFE >NZ_CP049868|4252513:4278017|4260649_4260832_+|WP_166210374.1|DBSCAN-SWA MAKVRVIASTIRYGSNGFKHKGDTFNLPDAEAKDKAAKKLVEIVEETKAVEPKVKIKTEK >NZ_CP049868|4252513:4278017|4276883_4278017_-|WP_166210422.1|integrase|DBSCAN-SWA MLTPKIILYVHKTYADNTHPIMLQYVKNGKPIRKVLGRCKKQDWLKSTNRVSSKNIEAPRINNDIEYALKNFGITKVLNFKAYFENIIENYRLKEQVSRHDVNKVVLAQLLEFDKDVDFEDITESFIYKFAAFLRDVKKNNPNSIKEKMHVLGKVLSGAKKAKMIKENALDDITFNKQRSTKTKLNVSEIQQIMSLELSGKMAESRDIFIASIFLRGIRIGDLITLKASNIIDNRLVYEERKTGKIHNIGIVEALKNIIDRWMVGNEFDYIFSFMDTDANVDKFIYKKAVKNAISKLSRYLKIIGEKIKITKNISPHAARHFFSKIANSTIKDTSITKDLIGHSSLAIHEGYISEISDDLVMDEYAEKVLENLKASQ >NZ_CP049868|4252513:4278017|4259133_4260369_+|WP_166210371.1|capsid|DBSCAN-SWA MFKYKTEEELGKMTAAERDQYAVEKREHENKERKADIDKALEKQKEAFDKEIDELKKANEETQKHADQLDIQLKKQGGFVQPKSLEAVITEEKEHLVKASKNKGSEHEFLIKADTLRASVVGNPSALDLDSIGQIGHRKLTLYDLFPKIPIGEGNNGVVRYVDWNAATITRAAKSVKEGESFPESTAKFATYTLDLKKIGDTIPMSEELIYDAPRFAKELKMFLETNVAIKIDTDLYSADGTGDEIKGLKASVPDYTPVASGIEDASINDLVVKVSEDITTDKGSKYAPDFALMNIKDINKRKLKKDANGNYIIVPFAKDDKIDNMLVVECNAVAVNEMIIGDSRYGAIYEVPGVYVATGLNGTDFGDDMQTLKARKRLNLLIRNADKTGFRRITSISAALVTLSEVEAGG >NZ_CP049868|4252513:4278017|4275284_4275845_+|WP_166210413.1|DBSCAN-SWA MNLTKKQISDVAAGIGVDYASLMAFMSVESGGIGFDTATGKIIIQFEPAWFKKKAPYAPSGLWSVNKVEKQSKEWLAFNDAYYKNADAAMESTSIGIGQIMGFHFKRLGYKTVGAMWEHARTGELAQLEQMAKFIATDSRLLNALMVKNWHLVAVYYNGGGYKELAEKYNREPYNISMEKAYLKYK >NZ_CP049868|4252513:4278017|4260831_4261311_+|WP_166210377.1|head,tail|DBSCAN-SWA MLPTLSDCKSYAQIDADYILDDGLISDLLKAAISWCEQYTGLLFTEQEITETKLLRHFRLKAPLISITSVKVLDENVDYNFTGEWVRSVNGVKTVIYRAGYPENTLPEPIKTAIKLMVQTLYRNREDYIVSDVTKAINQVPIGIKELLSPYSISGGLFL >NZ_CP049868|4252513:4278017|4275013_4275283_+|WP_166210410.1|DBSCAN-SWA MRKNAKTVTKNYDTDTVNGWKLSYEYESENGAAPVEIRVTGSKDAGSVFITKTGANTSFNFNGGSTDVAVISSVETEISEILAGYTANQ >NZ_CP049868|4252513:4278017|4258283_4259129_+|WP_166210368.1|DBSCAN-SWA MKFTCKELSGQSFETKQEMFAALKASKEAIIKQKTEAVKFSDHIDYSLKEDGTLKQEDGSATQLKYGDYVYPIINSTNYLDSHSDLHLYGIWDKSAEEQKGRIYFIINHDLSVGNVISYPKEVELIIKEVEWSKLGKSYPGSTQVLMFKAMVTEKSNPAAFYILRDKEDVQYSVRMRYVRLELAINDSSEYYKQEKAVFDKYLPLIVNQEKAIEDGYFWVIHEAEIYKEGSMVLFGSNDATATLYDIENKDIQLPNSTDEEPLKGAQNEERGSLLFNANLI >NZ_CP049868|4252513:4278017|4261310_4261625_+|WP_166210380.1|head,tail|DBSCAN-SWA MKRDRIKVYSLESVQDAGGGFNPDQRVLYWETAATVKAAKVKRDLQSYQTDLEIPMEFKVMFRRDKNVTKNMIISYEDQDYTIHSIVNVDQDSKDLLLTGITRA >NZ_CP049868|4252513:4278017|4263285_4263726_+|WP_166210389.1|DBSCAN-SWA MADLNFKNGTDNVLFVKIGAPAAWVAVACLKTNSWDGSTDQIDTTSKCSGKFKTSLPGDISWSFKGDGNAVDDSGAPSKASFKALSALHKAGTTFPCKMVGVDDPDDIIRGDVFITALSLSAGRNEAVAFSATFQGTGEYFTTPEA >NZ_CP049868|4252513:4278017|4253984_4254680_+|WP_166210356.1|DBSCAN-SWA MRKLLLVALLGLFLASCDRAQSNVQTLYTSNCGVSWTLIKAGETLPKGIGMCSYKITVPDYPMQGESVFKSAFANRVMAKIEVTYDYSITDAILYVGEAKYLGKINSDSDSETNSAKAYETAENSVIDKRIKEVARDLLINEDIVDFSQAEFETLLLEKVNELLKSKGVKINFLSFVPIPEDQTRQAIDVVTAMKIYESKKLTEVGKSVTSARAGATKIDVTVQKEKPTED >NZ_CP049868|4252513:4278017|4262064_4263258_+|WP_166210386.1|DBSCAN-SWA MTDFTPKVKAAYQYLNVGTWVVYYTGIDLTDYANDVKSFERKLEVFRADNNQLITSKTLAKDEFKINLLFRDGQYNTDPILNDLPIRVVLTLTRDGQTKIAEDIIDFVSVDQNAAPASIYLSLLSDGFKISDSNSYPIFNNKAQDDFSRYVVVSRRPTDESSVNKIEYVKELVNGVSSIDFDYFNEYVVEFDVLWINKVTNQLYVAHSGNYATNNPLLTSLYNAGGKYVGSAGKDPLASEDLAPNMGVIDPSNPEQPTSGTVLRDVVEPLRIAVRAKLLSTSVPIYDAFVPDSAPDSFIVIKDINEADDSLKSVFNGDVHVTLDIVTRFPQGSGTSSKRDQLTGQVYEKLIPNTVKIDHFHILNAVRTLSRPIDEDSNQYKILRKIIIIKYKIQQLN >NZ_CP049868|4252513:4278017|4255329_4256625_+|WP_166210362.1|DBSCAN-SWA MRLLPKQENAVYFLKDNVTEEILYGGAAGGGKSAFGCMWLIEMCQKYPGSRWLMGRSKLKTLKETTLNSFFDIASKLGVTNQYTYNDNKSTIYFHNGSQIILKDLFLYPSDPNFDSLGSLEITGAFIDECNQLVLKAWMVVKSRIRYKLSEFCLMPKMLGSCNPAKNYVYSEFYKPFKDGSLPKHRRFIQALPTDNPFLHPSYLQSLLRLDANSVQRLYYGNWEYDNDPSALILFNKIIDLFTNTFVKLGQKFISADIARMGADKGIVLVWEGLKVIDYLIIPKSKITEAASEIERLRKLHSVPLSNVIADEDGVGGGAVDILGCKGFVNNSKALFGENYFNLKAQCYYKLAEMINENLLDLSIFAAIAEVKDAIIQELEQVKRKDMDKDGKMQIVPKDEIKDLIGRSPDWSDAIMMRIWFEIDQFVFYVN |
26 | Cellulophaga_phage(27.27%) | capsid,portal,integrase,terminase,head,tail | attL 4274291:4274304|attR 4279766:4279779 |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DBSCAN-SWA_2 |
4291260 : 4297690
Sequences of DBSCAN-SWA_2
Nucleotide sequences of DBSCAN-SWA_2 >NZ_CP049868|4291260:4297690|DBSCAN-SWA TATGATCAATCAGAATATTAAAATCGCTGTCGACGCTATTGTTTTTGGCTACGAGAAAAACGTGCTTTACGTTTTGGCCGTTCAACAAAAATACGGGGTGTTTAAAGATAGGTGGGTTTTGCCCGGCGGTTTTATCAAAGATGATGAATCACTAATTGATGCAGTTAAACGGGAATTGCAGGAAGAGGCAGGTATCGGTGTAAATTATTTAGAGCAACTAAGCACATTTGGCGATGAGGTAAATCGCGATTCCCGCGGACGTGTAATATCTGTCGCTTATTTTGCCCTGGTTAATCCACAAAATTTTATGCTTAAAGCCGATACCGACGCAAAAGATGCGCGGTGGTTTCCGGTTAATGTGATTCCGGTGCTGGGCTACGATCATAATGAAATGGTAAGGCTGGCACACCAAAGATTAAAAGCTAAACTAACTTATCAGCCGATCGGTTTCGATTTGTTAGATGACGAATTCCTTTTCTCCGATCTTGAAAATTTGTATTGTTCCATTCTTGAACGCGATATTGACAGAAGAAATTTCAGAAAAAAAATTCTAAGTTTTGGTATCATAAAAGAAACTGATAAAGTTGTTAAAACGAGCTCCAGTGGCCGGCCAGGCAAGTTATTTAAGTTTGATAAAGCCAAATACGACCAGTTGTTACAAGAAGATTTTCAGTTTGAAATTAAGTTTGCGTAAAAATAACGCAAATAATATTTTGACTATTGAAAAGTGTTTTTATATTTGTGTAATTAATACGCAAATATATGATCAACTTAGATGAAAATTTCAGCCCGCTAGGCATAGAAAATGCTGTTCAGTTTCAGTCTTTCGTATTTGCCGGTGGCGAACCGCACATTAAAATAAGTGGTAGTTTCGATCCCGCATCGGTTGTGCAGATTACACACCGCATCAATTCTTTCAACGATCTGGGTTTAATCTGTACTACTGTTGATGCATTGAAGCGGATGGGGGTTAAGGCGATTAAGTTGTTTGTTCCTTATTTTCCGGCTGCAAGACAAGACCGGGTAATGATACCGGGCGAACCTTTAACGGTTAAAGTTTATGCCGATATCATTAATGCACTTGGTCTTGATAACGTAACTGTTTTCGATCCGCATTCGGAAGTTACCCCTGCTTTGTTAAATAACTGCACAGTAACTCCAAACCACGTTTTTATTCAGAAAGTTGTTGCGCAAATTGGCGGAGAGGTAAAACTGATTTCTCCTGATGGCGGTGCCTTGAAGAAAATTTATAAAGTTTCTGAATTTCTCGGCGGTGCAGAGGTAGTAGAGTGCTCGAAGAGCAGGGATGTTAAAACCGGCAAATTATCGGGTTTTAAAGTTTATGCTGACGATTTAAAAGGGGCAGATTGTTTAATCGTGGATGATATATGTGATGGTGGGGGAACCTTTATAGGTCTCGCTGAAGAACTCAAAAATAAAAATGCAGGGCATTTGTATCTGGCCATTAGTCACGGGATTTTTAGTAAGGGTTTTAATGAATTAGGTAAATATTTTGATCAGGTTTTTACCACCGATTCGATCAAAGAAATTGACCATGTTGTTGTAACACAACTAAAATTAACAGATATTTTATAAAAGAAATATGAAAACAGTTAATCCTCCTCAGGTTATTTCTGCATCCGATGTTTCGGTATTCCTTGCCGGTACCATTGATATGGGTAATGCTGATAATTGGCAGCAGAAATTTATTGATCATGCAAGTGCGGAGGAAACATTGGATCATGTAATCGTTTTCAATCCGCGCAGGGCATCTTGGGATCACAGCTGGACGCAGTCGATTGAAAATGCCCAATTTAGCGAACAGGTTAACTGGGAACTGGATGCGATGGAAAATGCAGATGTGATTTTGTTATTTCTGGAAGGCAATTCCAAATCACCTATTTCGATGATGGAGCTAGGTTTATTTGCCGATTCCGGTAAGTTAATGGTTTGTTGTGAAGATGGGTTTTGGAGAAAAGGCAATGTTGATATCGTTTGTAAAAGAAAAGGTATTGATCAGTATAATACGCACGATGAACTTAGTGCTGCTGTAATTGCTAAGCTTAAAAAGCTTGCAAAGTGTACGTAGGGTGATTTATTAAATTTAAAACAAATTGATATGAAATACGATATAAATTGGTTACTCGATATTATGAGTGGAAGCAATCCTGACTTTTTAATGTTCTGGGGACACCAAAGAAGCAAAGATGGATCGGTTATTAAAACTTGTATGAGCCAATGGTGGGCATCTCCATTTATTGAAAATCATATCACTTATCAAACAGCAGAGCATTATATGATGGCAAAAAAAGCTTTGTTGTTTAACGATCAACAGGTTTTTGAAAAAATATTAACAAAAGAGTCCCCGAAAGATGTAAAAGATCTGGGCAGGCAGATCCAAAATTTTAATGCAGAAGTCTGGGATGCGCATAAATTTGATATCGTAAAACAGGGCAACCTGCTTAAGTTTTCTCAAAATGAGGCACTGAAATTGTTCCTCTTACAGATCAAAAGTGAAATTCTGGTTGAAGCCAGCCCGGTTGATACAATTTGGGGAATTGGATTAGCGGAGGATAATGCCAATGCTTTAATCCCCAAAAACTGGAAAGGTTTAAATTTATTGGGTTTTGCCTTGATGGAAGTAAGGGATAAGATCTCCTGAAAAAAAGTTTACCAGTAAAAATTCAAAAAATGATTTTAGAAGTCATCAAAGCCGATATAACAACAATTAAAGCCGACGCAATTGTTAATGCCGCAAATAGTTCGCTGCTAGGTGGAGGCGGAGTGGATGGTGCAATCCACAGAAAAGGCGGCAAAGCAATCTTAGAAGCTTGTATGGTCATCAGAAATAACAAGGGTGGATGTAAAACCGGAGAGGCTGTGATCACAACGGCAGGCAATTTACCAGCAAAATATGTGATCCATACCGTTGGGCCGGTTTGGAACGGAGAAAGTGAAAAAAAGAATATTTTGCTCGCCAATTGCTATCAAAATAGTTTAACCCTTGCAGTAGAAAATGGCATTAAAGTTATTGCTTTCCCAAACATTAGCACAGGGATTTATCATTTCCCAAAAGATAAAGCAGTAGATATTGCCATTGCATCGGTAAATAATTTCGCTGAAAAGGAAAAGATAGAAAAAGTAATTTTCGTGTGTTTCGACGATGAGAATTACCTGCTTTATGAAGAGAAAATTAAAGGGTAGTATTATGGACAATAAAATAACAAAAGGCATAAGCAAACTACTAAGTTATATTTTGAGGCATTCGCCTGAAACAATAGGCTTAAAGCTCGATGAAAATGGCTGGGCAGATGTGAATGAGCTTATTGCTAAATTCGACCTTTATGATAGAAGAATAGATATTGAACAACTAGAATACATTGTAGAAAATAACGATAAACAAAGATTTGCGTTTAACGCAGATAAAACGAAAATCAGGGCAAATCAAGGGCATTCAATTCCGGTTGAGTTAAATTTAAATGAAACCGAACCCTTGGAATACCTGTATCATGGTACGGTTGAAGAATTCCTGTCAGACATTAAAGCGTTGGGCCTCCAGAAAATGAGCAGGCAGCATGTACATTTAAGCGCTGATAAGGAAACTGCAACCAAAGTAGGTGGTAGGAGAGGAAAACCTGTTGTACTAACCATTGATAGTGGGGCAATGTACCGGGCAGGATACAAATTTTATTTATCAGAGAACAACGTGTGGCTGACAGATTTTGTACCTGCTGAATACATAACATTTTAAAATATGAAAAGAACACTGGTAATAGGCGATATCCACGGAGGTTTAAAAGCCCTGATCCAGTTGTTGGAAAGGGCTTCGGTAACTAAACAGGACAGACTCATTTTTTTAGGCGATTATGTAGATGGCTGGAGCGAATCAGCACAGGTAATCCATTATCTTTTGCAACTGAAAGATGGTCATGAGTGTGTTTTTATCAGAGGAAATCATGATGTGTGGTGTGAAGATTGGTTAAGGAGTGCTGTTGTAGATGAAATCTGGTATCAGCATGGTGGTAAAGAAACTATAGAAAGTTATGCCGGTATTGATATTGATGAGCAGAAAAAACACCTGACTTTTTTTGAGCAGACGGAAGATTATCACGTAGACGAGCAAAATAACCTATTCATCCATGCCGGGTTTTCGTCTATGCATGGGCCGGCTAAAGAGCGTTATGTTTCCAATTATTCGTGGGACAGGACCTTGTGGGAAGTGGCGCTCACGATGGATAATCGGATTGAAAAAGACTCTGCGTTATATCCTAAGCGGCTTTTACTTTTTAACGAAATTTATATAGGCCATACCCCAACGCTCTATTATAATGTAGAAGTTCCAATGAACGGTTGTAATGTTTGGAACATGGATACAGGAGCGGCATTTACAGGAAAATTAACCTGTTTGGATATCGAAACGAAACAATTTTGGCAGAGTGATACTTTACAAAGCCTGTATCCAAACGAAAAAGGAAGAAATTAAAGATGAAAAATATTGAATATAAGAAAGGTGACGCAACAAATCCCTCAGATAACGGAAATAAGATAATCGTTCATATATGTAACAACATTGGCGGGTGGGGAAAGGGATTCGTATTAGCGATTTCAAAAAGATGGAAGGCTCCAGAAAATAGTTACAGAGCCTGGTATCTATCGAAAGATAATTTCAATCTTGGTGAAGTTCAGTTTGTACAGGTGGAACAAGATTTATGGATAGCCAATTTAATTGGTCAGCATAAAATAATTAAAGATGAGAATGGCAATGCTCCCATAAGATATGATGCCGTAGAAGAAGGCTTAAGAAAGGTTGCAGATTTTGCAGGTGACCTTAATGCCTCGGTCCACATGCCAAGAATAGGATGTGGTTTAGCAGGAGGAGAATGGGGAATAATTGAGCCAATTATTAAAGAAACAATTTCGAAGAAAGATATTAATACAACAGTTTACGATTTTTAAAAGATAGAACCATGAACCCATTATTATTAACAGATGGTTACAAAGTTGACCACAGACGACAATATCCTGAACACACCACATTAGTCTACTCTAACTGGACACCAAGAAAAACCCGATACGAAGAAATCAATCATGTGGTTTTATTTGGCTTACAATACTTTATCAAAAAATATATTATCGAAGAGTTTGATAAAAACTTTTTCAGTCAGCCTAAAGAGGAAGTTTTAAAAAAATATGCCCGCCGCATTAACAATTACCTGGGCGAAAACCAGGTAGGTACTGCCCATATTGGTGCCTTACACGATCTGGGTTACATTCCGATGGTATTTAAATCTTTACCAGAAGGATCGAAAGTGCCCTTGCGTATTCCGATGTTTACCATGTACAATACGTTACCTGAGTTTTTTTGGCTGACTAATTATTTCGAAACATTGCTGTCGGCAGTGATTTGGTTGCCTTGTAATTCTGCAACGTTGGCGCTTCAATACCGCGGCATTTTGGAAAGGGCTGCTGCAGAAACTTCGTCAGTGCCCGAATTTGTAAACTGGCAGGGACACGATTTCTCTATGCGCGGTATGGGTGGCATAGAAGCTGCGGTTACTTCGGCAGCTGGCCATTTATTGAGTTTTACCGGAACTGACACTATCCCGGCAATTGATTTTCTGGAAGAATATTACAATGCCAATTCGGATGAGGAACTGATCGGCGGTTCAGTTGCCGCAACAGAACATTCGGTAATGTGCATGGGAACAAATACCGGCGAACTCGAAACCTTCAAAAGGTTGATCCAGGAAGTTTATCCCAATGGGATTGTTTCTATTGTTTCCGATACCTGGGATTTATGGAAGGTTTTAACTGAATACCTTCCTCAGCTAAAAAATGAAATAGTTAATCGGGAAGGAAAAGTGGTAATTCGCCCCGATTCTGGTGATCCTGTTGACATTATCTGCGGTAACGCAAACGGTAAGGATGAAAACGAGCGGAAAGGCGTAATTGAGCTGCTTTGGGACGTTTTTGGAGGAACAGTAAATGCAAAAGGTTTTAAAGAACTTGTTCCACAGATTGGTGCCATCTATGGCGATAGCATTAATTTAGAAAGAGCCAGCCAGATTTGCCAAAGGTTAAAAGCAAAAGGTTTTTCTTCTACCAATGTGGTATTGGGTATTGGTTCCTTTACTTATCAGTACAACACCCGTGATACCTTTGGTTTTGCCATGAAAGCAACTTATGGAGAAGTAAAAGGCGAAGGTCGCGAGATTTTTAAAGACCCTGTTACCGATGATGGCACCAAAAAATCGGCCAAAGGTTTGTTACAGATTTTTAAAGATGCAAACGACGAATATCAGCTAAAAGATCAATGCACCTGGGAGGAAGAAAGGAAAGGCGAACTAAAAGAAGTATTCAGGGATGGAAAATTGTTGATCGATCAATCGCTGGCCGAAATCAGGGACCGCATAAGAGAAAGTCAGATATAG
Protein sequences of DBSCAN-SWA_2 >NZ_CP049868|4291260:4297690|4295744_4296215_+|WP_124562301.1|DBSCAN-SWA MKNIEYKKGDATNPSDNGNKIIVHICNNIGGWGKGFVLAISKRWKAPENSYRAWYLSKDNFNLGEVQFVQVEQDLWIANLIGQHKIIKDENGNAPIRYDAVEEGLRKVADFAGDLNASVHMPRIGCGLAGGEWGIIEPIIKETISKKDINTTVYDF >NZ_CP049868|4291260:4297690|4296226_4297690_+|WP_166210431.1|DBSCAN-SWA MNPLLLTDGYKVDHRRQYPEHTTLVYSNWTPRKTRYEEINHVVLFGLQYFIKKYIIEEFDKNFFSQPKEEVLKKYARRINNYLGENQVGTAHIGALHDLGYIPMVFKSLPEGSKVPLRIPMFTMYNTLPEFFWLTNYFETLLSAVIWLPCNSATLALQYRGILERAAAETSSVPEFVNWQGHDFSMRGMGGIEAAVTSAAGHLLSFTGTDTIPAIDFLEEYYNANSDEELIGGSVAATEHSVMCMGTNTGELETFKRLIQEVYPNGIVSIVSDTWDLWKVLTEYLPQLKNEIVNREGKVVIRPDSGDPVDIICGNANGKDENERKGVIELLWDVFGGTVNAKGFKELVPQIGAIYGDSINLERASQICQRLKAKGFSSTNVVLGIGSFTYQYNTRDTFGFAMKATYGEVKGEGREIFKDPVTDDGTKKSAKGLLQIFKDANDEYQLKDQCTWEEERKGELKEVFRDGKLLIDQSLAEIRDRIRESQI >NZ_CP049868|4291260:4297690|4292862_4293348_+|WP_124562297.1|DBSCAN-SWA MKTVNPPQVISASDVSVFLAGTIDMGNADNWQQKFIDHASAEETLDHVIVFNPRRASWDHSWTQSIENAQFSEQVNWELDAMENADVILLFLEGNSKSPISMMELGLFADSGKLMVCCEDGFWRKGNVDIVCKRKGIDQYNTHDELSAAVIAKLKKLAKCT >NZ_CP049868|4291260:4297690|4291260_4291953_+|WP_124562295.1|DBSCAN-SWA MINQNIKIAVDAIVFGYEKNVLYVLAVQQKYGVFKDRWVLPGGFIKDDESLIDAVKRELQEEAGIGVNYLEQLSTFGDEVNRDSRGRVISVAYFALVNPQNFMLKADTDAKDARWFPVNVIPVLGYDHNEMVRLAHQRLKAKLTYQPIGFDLLDDEFLFSDLENLYCSILERDIDRRNFRKKILSFGIIKETDKVVKTSSSGRPGKLFKFDKAKYDQLLQEDFQFEIKFA >NZ_CP049868|4291260:4297690|4295013_4295742_+|WP_166210428.1|DBSCAN-SWA MKRTLVIGDIHGGLKALIQLLERASVTKQDRLIFLGDYVDGWSESAQVIHYLLQLKDGHECVFIRGNHDVWCEDWLRSAVVDEIWYQHGGKETIESYAGIDIDEQKKHLTFFEQTEDYHVDEQNNLFIHAGFSSMHGPAKERYVSNYSWDRTLWEVALTMDNRIEKDSALYPKRLLLFNEIYIGHTPTLYYNVEVPMNGCNVWNMDTGAAFTGKLTCLDIETKQFWQSDTLQSLYPNEKGRN >NZ_CP049868|4291260:4297690|4293950_4294463_+|WP_124562299.1|DBSCAN-SWA MILEVIKADITTIKADAIVNAANSSLLGGGGVDGAIHRKGGKAILEACMVIRNNKGGCKTGEAVITTAGNLPAKYVIHTVGPVWNGESEKKNILLANCYQNSLTLAVENGIKVIAFPNISTGIYHFPKDKAVDIAIASVNNFAEKEKIEKVIFVCFDDENYLLYEEKIKG >NZ_CP049868|4291260:4297690|4293378_4293921_+|WP_124562298.1|DBSCAN-SWA MKYDINWLLDIMSGSNPDFLMFWGHQRSKDGSVIKTCMSQWWASPFIENHITYQTAEHYMMAKKALLFNDQQVFEKILTKESPKDVKDLGRQIQNFNAEVWDAHKFDIVKQGNLLKFSQNEALKLFLLQIKSEILVEASPVDTIWGIGLAEDNANALIPKNWKGLNLLGFALMEVRDKIS >NZ_CP049868|4291260:4297690|4294467_4295010_+|WP_124562358.1|DBSCAN-SWA MDNKITKGISKLLSYILRHSPETIGLKLDENGWADVNELIAKFDLYDRRIDIEQLEYIVENNDKQRFAFNADKTKIRANQGHSIPVELNLNETEPLEYLYHGTVEEFLSDIKALGLQKMSRQHVHLSADKETATKVGGRRGKPVVLTIDSGAMYRAGYKFYLSENNVWLTDFVPAEYITF >NZ_CP049868|4291260:4297690|4292021_4292855_+|WP_124562296.1|DBSCAN-SWA MINLDENFSPLGIENAVQFQSFVFAGGEPHIKISGSFDPASVVQITHRINSFNDLGLICTTVDALKRMGVKAIKLFVPYFPAARQDRVMIPGEPLTVKVYADIINALGLDNVTVFDPHSEVTPALLNNCTVTPNHVFIQKVVAQIGGEVKLISPDGGALKKIYKVSEFLGGAEVVECSKSRDVKTGKLSGFKVYADDLKGADCLIVDDICDGGGTFIGLAEELKNKNAGHLYLAISHGIFSKGFNELGKYFDQVFTTDSIKEIDHVVVTQLKLTDIL |
9 | Bacillus_virus(11.11%) | NA | NA |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
Acr ID | Acr position | Acr size | Homology with known anti | Neighbor HTH/AcRanker | Neighbor Aca | In prophage | Protospacer in prophage |
---|