שמיר החל את הקריירה המדעית שלו[1][2][3][4] בחקר ביצועים, בחן בעיות אופטימיזציה הקשורות לתכנון ליניארי ולשיטת הסימפלקס. עבודת הדוקטורט שלו עם אדלר וקרפ עסקה בניתוח מקרים ממוצע של שיטת סימפלקס והראתה כי גרסה מסוימת של סימפלקס הייתה ריבועית במודל נתוני קלט פשוט[5]. תוצאות דומות ניתנו במקביל על ידי מייקל טוד ועל ידי אדלר ונמרוד מגידו. בהמשך עבד עם דורית הוכבאום על אלגוריתמים יעילים לבעיות אופטימיזציה מובנות.[6]
תורת הגרפים האלגוריתמיים
בתחילת שנות ה-90 שמיר הפנה את עיקר מרצו לתורת הגרפים האלגוריתמיים. יחד עם תלמידיו, חיים קפלן ומרטין גולומביץ', הוא חקר בעיות של כריכי גרפים[7], בעיות השלמת גרפים ומגוון בעיות הקשורות לתרשימי מרווחים[8][9]. אחד המאמרים שלו בנושא בעיית הסקה עיתית הוחל מאוחר יותר על חקר המיפוי הפיזי של ה-DNA; [10] הדבר סימן את כניסתו לתחום הביולוגיה החישובית.
ביואינפורמטיקה
שמיר השתמש במומחיות שלו בתורת הגרפים לפיתוח אלגוריתמי קיבוץ (clustering) לניתוח בעיות ביטוי גנים. המאמר הראשון שלו בתחום זה, עם ארז הרטוב, הציג את אלגוריתם הקיבוץ HCS[11]. אלגוריתם ה- CAST שלו, עם זוהר יכיני ועמיר בן דור, פורסם בשנת 1999[12] ומשך תשומת לב רבה מקהילת הביואינפורמטיקה; הטכניקות המתוארות במאמרו בנושא זה, הפכו פופולריות בניתוח נתונים גנומיים. אלגוריתם האשכולות CLICK[13] עם רודד שרן ואלגוריתם SAMBA עם עמוס תנאי ורודד שרן לדו-גלגל[14] מצויים בשימוש רחב.
המחקר הנוכחי של שמיר מתמקד בניתוח אינטגרטיבי של נתונים ביו-רפואיים הטרוגניים עם תפוקה גבוהה, סידורי גנום בסרטן, ויסות גנים.
פעילויות נוספות
שמיר היה בוועדת ההיגוי המייסדת של כנס RECOMB[22], הכנס העיוני הראשי בביואינפורמטיקה, וכיהן בה במשך 13 שנה. הוא הקים את החברה הישראלית לביואינפורמטיקה וביולוגיה חישובית והיה נשיא החברה בין השנים 2004–2006. הוא הקים את מרכז אדמונד י' ספרא לביואינפורמטיקה באוניברסיטת תל אביב ועמד בראשו בשנים 2006-2022, ומכהן כראש הקתדרה לביואינפורמטיקה ע"ש ריימונד ובברלי סאקלר[23]. שמיר מקדיש זמן גם לחינוך ביואינפורמטיקה. הוא כתב סיכומי הרצאות מקיפים הנמצאים בשימוש נרחב, בנושאי גנומיקה חישובית (אלגוריתמים לביולוגיה מולקולרית), ניתוח ביטוי גנים, שבבי DNA ורשתות גנים. הוא הקים את התוכנית המשותפת למדעי החיים ומדעי המחשב לתואר ראשון בביואינפורמטיקה באוניברסיטת תל אביב, וכן לימד קורסי הליבה של התוכנית ופיקח על תארים מתקדמים במסגרת תוכנית זו. כמו כן, ערך יחד עם פבל א' פבזנר את הספר "ביואינפורמטיקה לביולוגים"[24] .
^Ben-Dor, A.; Shamir, R.; Yakhini, Z. (1999), "Clustering gene expression patterns", Journal of Computational Biology, 6 (3–4): 281–297, doi:10.1089/106652799318274, PMID10582567
^Sharan, R.; Maron-Katz, A.; Shamir, R. (2000), "CLICK: A Clustering Algorithm with Applications to Gene Expression Analysis", Intelligent Systems in Molecular Biology - ISMB, 19 (14): 307–316, doi:10.1093/bioinformatics/btg232, PMID14512350.
^Sharan, R.; Maron-Katz, A.; Shamir, R. (2003), "CLICK and EXPANDER: a system for clustering and visualizing gene expression data", Bioinformatics, 19 (14): 1787–1799, doi:10.1093/bioinformatics/btg232, PMID14512350
^Adler, Ilan; Karp, Richard M.; Shamir, Ron (1987), "A simplex variant solving an m × d linear program in O(min(m^2, d^2)) expected number of pivot steps", Journal of Complexity, 3 (4): 372–387, doi:10.1016/0885-064X(87)90007-0
^Hochbaum, Dorit S.; Shamir, Ron (1991). "Strongly Polynomial Algorithms for the High Multiplicity Scheduling Problem". Operations Research. 39 (4): 648–653. doi:10.1287/opre.39.4.648. ISSN0030-364X.
^Golumbic, Martin Charles; Kaplan, Haim; Shamir, Ron (1995), "Graph Sandwich Problems", Journal of Algorithms, 19 (3): 449–473, doi:10.1006/jagm.1995.1047
^Kaplan, Haim; Shamir, Ron (1996), "Pathwidth, Bandwidth, and Completion Problems to Proper Interval Graphs with Small Cliques", SIAM Journal on Computing, 25 (3): 540–561, doi:10.1137/S0097539793258143
^Kaplan, Haim; Shamir, Ron; Tarjan, Robert E. (1999), "Tractability of Parameterized Completion Problems on Chordal, Strongly Chordal, and Proper Interval Graphs", SIAM Journal on Computing, 28 (5): 1906–1922, doi:10.1137/S0097539796303044
^Golumbic, M.C.; Kaplan, H.; Shamir, R. (1994), "On the Complexity of DNA Physical Mapping", Advances in Applied Mathematics, 15 (3): 251–261, doi:10.1006/aama.1994.1009
^Hartuv, E.; Shamir, R. (2000), "A clustering algorithm based on graph connectivity", Information Processing Letters, 76 (4–6): 175–181, doi:10.1016/S0020-0190(00)00142-3
^Ulitsky, I.; Shamir, R. (2007), "Identification of functional modules using network topology and high-throughput data", BMC Systems Biology, 1 (8): 8, doi:10.1186/1752-0509-1-8, PMC1839897, PMID17408515
^Kaplan, H.; Shamir, R.; Tarjan, R.E. (1999), "A Faster and Simpler Algorithm for Sorting Signed Permutations by Reversals", SIAM Journal on Computing, 29 (3): 880–892, doi:10.1137/s0097539798334207
^Elkon, R.; Linhart, C.; Sharan, R.; Shamir, R.; Shiloh, Y. (2003), "Genome-Wide In Silico Identification of Transcriptional Regulators Controlling the Cell Cycle in Human Cells", Genome Research, 13 (5): 773–780, doi:10.1101/gr.947203, PMC430898, PMID12727897
^Linhart, C.; Halperin, Y.; Shamir, R. (2008), "Transcription factor and microRNA motif discovery: The Amadeus platform and a compendium of metazoan target sets", Genome Research, 18 (7): 1180–1189, doi:10.1101/gr.076117.108, PMC2493407, PMID18411406
^Tanay, A.; Regev, A.; Shamir, R. (2005), "Conservation and evolvability in regulatory networks: The evolution of ribosomal regulation in yeast", Proceedings of the National Academy of Sciences USA, 102 (20): 7203–7208, Bibcode:2005PNAS..102.7203T, doi:10.1073/pnas.0502521102, PMC1091753, PMID15883364
^Sharan, Roded; Ideker, Trey; Kelley, Brian; Shamir, Ron; Karp, Richard M. (ביולי 2005). "Identification of protein complexes by comparative analysis of yeast and bacterial protein interaction data". Journal of Computational Biology. 12 (6): 835–846. doi:10.1089/cmb.2005.12.835. ISSN1066-5277. PMID16108720. {{cite journal}}: (עזרה)