<div dir="ltr"><br>
In short, this is the method google use for parallel processing.
Every operation which needs to be parallel is divided into a mapping stage (where each worker does
something on their own data, and produces a result) and a reduction
stage, where the results of the map are collected into a meaningful
result. This parallelization scheme is highly scalable.<br><br>This (upcoming) Sunday&#39;s slides on Map-Reduce from the concurrent and Distributed Programming course:<br>&nbsp;<a href="http://webcourse.cs.technion.ac.il/236370/Winter2008-2009/ho/WCFiles/map-reduce-lecture.pdf">http://webcourse.cs.technion.ac.il/236370/Winter2008-2009/ho/WCFiles/map-reduce-lecture.pdf</a><br>
And a canonical paper, linked from the same place:<br><a href="http://labs.google.com/papers/mapreduce-osdi04.pdf">http://labs.google.com/papers/mapreduce-osdi04.pdf</a><br><br>Orna.<br><br><div class="gmail_quote">On Wed, Jan 14, 2009 at 10:27 PM, guy keren <span dir="ltr">&lt;<a href="mailto:choo@actcom.co.il">choo@actcom.co.il</a>&gt;</span> wrote:<br>
<blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;"><br>
can you explain, briefly, what map-reduce is, so those not in the know<br>
(like me) will be able to decide if this is interesting? ;)<br>
<br>
thanks,<br>
<font color="#888888">--guy<br>
</font><div><div></div><div class="Wj3C7c"><br>
Eran Sandler wrote:<br>
&gt; Hi all,<br>
&gt;<br>
&gt; It&#39;s been a while since I&#39;ve posted to Haifux (or Linux-IL for that<br>
&gt; matter) but I am watching the mailing list from time to time and due to<br>
&gt; personal reasons found myself as a Haifa citizen for the past year (and<br>
&gt; probably for a couple more years :-) ).<br>
&gt;<br>
&gt; Somewhere in 2004 I even did a lecture on Mono, the open source .NET<br>
&gt; implementation, if some of you recall.<br>
&gt;<br>
&gt; Recently I&#39;ve been involved with a cool open source project called Disco.<br>
&gt;<br>
&gt; Disco is an open source Map-Reduce framework written in Erlang and<br>
&gt; Python. It was written at Nokia&#39;s Palo Alto research center as a<br>
&gt; lightweight framework for rapid scripting of distributed data processing<br>
&gt; tasks but grew to become even more than that and is now even used for<br>
&gt; probabilistic modeling, data mining, full text indexing, etc.<br>
&gt;<br>
&gt; You can read more about Disco at <a href="http://discoproject.org" target="_blank">http://discoproject.org</a><br>
&gt;<br>
&gt; Would a lecture on Map-Reduce in general and specifically Disco would<br>
&gt; interest people?<br>
&gt;<br>
&gt; If so, I&#39;m more than willing to give the lecture and show some examples.<br>
&gt;<br>
&gt; Eran<br>
&gt;<br>
&gt;<br>
</div></div>&gt; ------------------------------------------------------------------------<br>
<div><div></div><div class="Wj3C7c">&gt;<br>
&gt; _______________________________________________<br>
&gt; Haifux mailing list<br>
&gt; <a href="mailto:Haifux@haifux.org">Haifux@haifux.org</a><br>
&gt; <a href="http://hamakor.org.il/cgi-bin/mailman/listinfo/haifux" target="_blank">http://hamakor.org.il/cgi-bin/mailman/listinfo/haifux</a><br>
<br>
_______________________________________________<br>
Haifux mailing list<br>
<a href="mailto:Haifux@haifux.org">Haifux@haifux.org</a><br>
<a href="http://hamakor.org.il/cgi-bin/mailman/listinfo/haifux" target="_blank">http://hamakor.org.il/cgi-bin/mailman/listinfo/haifux</a><br>
</div></div></blockquote></div><br></div>