Monthly Archives: October 2009

Job

Vi söker utvecklare

Tailsweep har en enorm utvecklingstakt och vi behöver stärka upp vårt utvecklingsteam med fler utvecklare.

Tailsweep är ett datadrivet företag som i alla aspekter hanterar stora mängder data. Har du erfarenhet av att skriva program som processar stora mängder data (gärna med nedan nämnda tekniker) eller helt enkelt har följande två enkla egenskaper:

  • Vara smart
  • Få saker utförda

Så är du med största sannolikhet rätt person för jobbet och du kommer trivas hos oss. De “krav” som nämns nedan är endast för att ge en hint om vilka tekniker vi använder. Främst letar vi efter personer som passar i bolaget och som älskar att utveckla och är bra på det. Allt annat är egentligen ointressant.

De tre områden som du kommer arbeta inom är:

  • Tailsweep Search & Report – Crawler & Sökindex, ett av sveriges absolut största dataindex för blogginnehåll.
  • Tailsweep Analytics – Vårt statistiksystem, påminner mycket om Google Analytics. I princip alla de största svenska bloggarna är anslutna till detta system. Förmodligen det mest avancerade i Sverige.
  • Tailsweep Ad System – Vårt annonssystem som publicerar kampanjer på tusentals sajter på bloggar runtom i världen varje dag. De tekniska utmaningarna inom detta system är mycket intressanta för att vara modest.

Om du har erfarenhet inom nedan nämnda tekniker ges det en guldstjärna i kanten:

  • Hadoop – Processar vårt loggdata och kör vår crawler
  • HBase – Används bara i utveckling men kommer bli en viktig komponent framåt för ytterligare uppskalning
  • Hive – Skall bli vår BI-lösning
  • Lucene – Använder vi flitigt där skalbarhet inte är lika viktigt men “närhet” till datat är viktigare
  • Lucene SOLR – Vårt sökindex använder SOLR och är ett distribuerat index
  • Lucene Nutch – Kan du Nutch så kan du det mesta om vår crawler
  • Någon annan dataminingplattform
  • Någon annan BI-lösning
  • Någon annan sökplattform (Sphinx tex)
  • Någon annan indexmotor

Det språk vi i huvudsak utvecklar i är Java så det är viktigt att du behärskar det språket men om du besitter andra nischade kunskaper så väger det såklart också tungt tex genom erfarenhet inom nån sökmotor, statistiksystem eller liknande.

Vi skriver i princip alla våra mallar i Velocity så det är klart att det är trevligt om du sett det mallspråket förr.

Vi driftar, utvecklar och arbetar på Ubuntu Linux. Vi använder samma OS lokalt som på driftplattformen för att säkerställa att inga konstiga OS-relaterade buggar hittar ut i prod som inte gick att testa lokalt.

Andra meriterande teknikkunskaper

  • MySQL – Vår huvudsakliga DB
  • J2EE Servlet Applikationer – Våra webappar är skrivna för J2EE och driftas i Tomcat
  • Spring – Denna IOC-container använder vi överallt
  • Spring MVC – För våra webappar
  • Hibernate – Används överallt där inte prestanda är kritiskt
  • Perl – Listar också perl då vi har massor av batchjobb som kör perl

Vidare listar jag några andra verktyg och tekniker som används flitigt men som bara är kuriosa i sammanhanget

  • Subversion – All vår källkod finns i Subversion
  • Maven – Alla projekt byggs med Maven 2
  • Lighttpd – Driftar vårt statiska innehåll och våra bloggar
  • WordPress – Våra bloggar körs i wordpress
  • BASH – Ja vi använder bashscript överallt
  • NFS – Används mest ur bekvämlighetssynpunkt
  • GlusterFS – Experimentiellt skalbart filsystem
  • Eclipse – Utvecklar vi i.
  • HAProxy – Vår LB, enkel, snabb och stabil
  • SNMP – Alla maskiner övervakas med SNMP
  • Postfix – Mail
  • Nagios – Larm av våra viktigaste tjänster
  • Cacti – Trendgrafer av prestandakritiska tjänster
  • Mantis – Vårt case-verktyg, enkelt och tillfredställande

Exempel på projekt för att komma igång på Tailsweep

  • Vi ska bygga om vår statistikmotor till att använda Hive istället för MonetDB som vi använder idag. Hive är utmärkt till att processa enorma mängder loggfiler och detta är vår viktigaste tjänst.
  • Vi har byggt en egen shardad lösning i MySQL som spänner över 50 databaser i vår sökplattform men vi tittar på att flytta denna arkitektur till HBase, vilket är en variant av Googles BigTable som hanterar all data rörande inloggade Google användare.
  • Vi ska bygga en behavioural targeting motor som ska distribuera kampanjer till de sajter där de presterar bäst. Till detta så måste man bygga en annonspool som kampanjerna “sugs” ifrån.

Låter det intressant ? Då kommer du gilla att jobba på Tailsweep.

Skicka ett mail till job at tailsweep.com med din CV så kontaktar jag dig och sätter upp ett möte.

Med vänlig hälsning

//Marcus Herou, CTO Tailsweep AB